前回、Microsoft Azureのコグニティブ機能である「 Computer Vision API 」の「TAG IMAGE(画像から情報を解析し、抽出)」 をASTERIA Warpから簡単に利用できるコンポーネントをご紹介しました。
今回は、同じく8月にリリースされた Computer Vision APIの OCRを利用するコンポーネントを試してみたいと思います!
と、その前に「OCR」がどんな感じに利用できるのかご紹介しておきたいと思います。
目次
まず、「OCR」とは Optical Character Recognition "(光学文字認識)の略で、画像データ内の文字を認識し、テキストデータ化する機能です。
上図のような単純なテキスト化では問題ありませんでしたが、文章になると精度がどんなレベルなのか気になるところになりますので、その辺りも含めて試してみます。
ちなみに、この書籍については▼こちら▼から詳細をご確認いただけます。
なんと今なら評価版お申し込みで書籍プレゼントしていますので、ご興味あればぜひお試しくださいね!
さて、本題に戻ります…
次にテキストデータ化する対象は、精度の検証のため単調なレイアウトではないものとして、弊社のASTERIA Warp導入事例のリーフレットで試してみたいと思います。
こちらですね↓
テキスト量もあり、まあまあレイアウトも複雑ですが、さてちゃんと取得できるでしょうか…
ちなみに、 Computer Vision APIサービスの OCR機能を利用するコンポーネントはこちらです!
実際にASTERIA Warpで処理を作成すると、以下のようなイメージになります。
白抜き文字や文字がバラバラに配置されているレイアウトでも、取得順に多少前後はあるものの問題なく取得できていますね!
ただ、ロゴ等文字ではないものが含まれている場合、文字として誤認識して近しい文字にしてしまうようです。
カタカナや記号の一部に誤認識はあるものの、今回のような文章と箇条書きが入り混じっているレイアウトでも箇条書き毎に取得できるようですね!
また、今回のレイアウトには存在しませんでしたが、こんな横書きと縦書きの場合でも、単純なものなら文字を取得できるようです!
このような機能を利用すれば、紙しかなかった資料からも簡単にテキストデータ化することで、資料をまとめることも可能になりますね!
あとは、今のところ手書きの文字には「英語」のみ対応しているようですが、日本語にも対応するようになれば、アンケート用紙に記入された文字、打ち合わせ時にホワイトボードへ書いた文字、ノートにメモ書きした文字なども、" 写真を撮るだけ "でテキストデータ化できれば活用範囲も大幅に増えると思うので、今後に期待したいと思います!
今回の内容はここまでとなりますが、いかがでしたか?
ぜひ身近な紙資料の整理などで試してみてくださいね。
次回以降のブログも様々なものと繋いでいきたいと思いますので、お楽しみに!
ASTERIA Warpは、最新技術やIoTとも簡単に”つなげる”ことができるので、今後さまざまな場面で活躍しそうです。
30日間無料体験版もご用意していますので、ぜひこの機会に簡単連携を試してみませんか?
そして今ならなんと!!評価版をお申込みいただきますと抽選で
「ASTERIA Warp 基礎と実践」書籍をプレゼントキャンペーン中ですので、ぜひこの機会にお試しください!!
西日本地域を活動拠点としている、ASTERIA Warpシリーズのプリセールスエンジニア 兼 営業担当。
Related Posts
ASTERIA Warp製品の技術情報やTips、また情報交換の場として「ADNフォーラム」をご用意しています。
アステリア製品デベロッパー同士をつなげ、技術情報の共有やちょっとしたの疑問解決の場とすることを目的としたコミュニティです。