SSブログ

Winactor pdfを操作してみる [Winactor]

これまでは決まったフォームに指示内容を登録して、期間業務システムに入力する。
という動作を主にやってきましたが、次はpdfできた書類をフォームに落とし込む作業をRPA化していくことにしました。

IEの操作が中心でしたが、これからはpdfの操作が中心になります。
具体的には注文書なのですが、注文書はフォームが決まっているので、
決まったところの文字を取得し、基幹システムへ入力するためのフォームに落とし込みます。

まずはAcrobatReaderでテキスト情報を読み取れるかやってみます。
AcrobatReaderで注意することは、保護モードをまずは解除することです。
マニュアルに記載されてるのですが、保護モードが有効になっているとWinactorでちゃんとウインドウ選択ができません。
AcrobatReaderを起動し、[編集]-[環境設定]で設定画面を開き、セキュリティ(拡張)を選んで、「起動時に保護モードを有効にする」のチェックを外します。
20200621_001.jpg
あとこれは必須ではありませんが、「一般」にある「単一のショートカットキーでツールを使用可能にする」にチェックを入れました。

これで準備完了
サンプルのpdfを元に各項目を選択していくのですが、これがなかなか曲者でした;;
結局Readerでのテキスト取得はあきらめました。
IEでは画面上でShiftキーを押しながらMAXテキスト範囲が表示される範囲の始点・終点をクリックしたらテキストが選択できたのですが、pdfではどうもうまくいかない;;
長さが可変するテキストに対し、その長さに合わせて終点のクリック位置を変えないとうまく選択できないという問題がありました。
それがダメなら、テキスト上でダブルクリックしたらいいかと考えてやってみましたが、これpdf作成時の構成の問題だろうと思うのですがこれでうまく選択できる箇所とできない箇所がありました。

今の私には難易度高すぎ。ということで、pdfから直接読み取りするのはあきらめ、AcrobatDCを購入して一度excel形式でエクスポート。その後、excelからテキスト取得することにしました。
てことでexcelでエクスポートする作業までをRPA化しました。
割とAcrobatはキーボードショートカットが充実してるので割と簡単にシナリオは作ることができました。

あとはexcel立ち上がってから、定型フォーマットにコピー&ペーストしていきます。
これでひとまずexcel落とし込みまで完了です。
あとは基幹システムへの登録部分の作りこみと、pdf→excel変換をいろんなパターンで実践して、同じ位置でexcel出力できるか。の検証になります。
nice!(0)  コメント(0) 
共通テーマ:仕事

nice! 0

コメント 0

コメントを書く

お名前:
URL:
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。