30 | 1月 | 2013 | HMDT Blog

カテゴリー : 2013年 1月30日

PDFの縦書き部分からテキスト抽出


最近続けているPDFの読み込み処理。縦書きPDFのテキスト抽出ができるようになってきた。

スクリーンショットは、縦書き表示があるPDFを読み込んで、PDF Kitと独自処理実装でテキスト抽出したもの。PDF Kitでは文字はとれるものの文章の体をなしていなけど、独自実装ではちゃんと文章になっている。

まだ問題はあるけど、まあ目処がついてきたかな。実装は、OS XとiOSに対応。

Map KitにPOI検索のためのMKLocalSearchが追加


Appleが、Map Kitを拡張してPOI (Point of Interest)を検索できるようにした、と発表。POIってのは、駅とか、飲食店とか、学校とかいった、地図上にある地形情報じゃないタイプのデータのこと。

APIが拡張されて、MKLocalSearch、MKLocalSearchRequest、MKLocalSearchResponseといったクラスが追加された。これを使うと、位置の領域や文字列を指定して、それに対応するMKMapItemを取得できるようだ。いままでも、CLGeocoderを使って似たような事ができていたけど、もっときちんとサポートされたらしい。iOS 6.1から使用可能。

この機能は、日本とロシアでは非サポートらしい。そりゃそうだよなー。マップのデータは、地形データはともかく、POIデータの無茶苦茶っぷりは酷すぎるからな。ものすごくAppleに好意的に考えれば、現在日本のPOIデータは絶賛改修中なのでもう少し待ってね、というメッセージ。普通に考えれば、日本のPOIデータもうどうにもならなかいから非サポート、放置する、というメッセージ。

iOS 6の地図の酷さについては、先日ちょっと検証をしてみた。日系ソフトウェアっていう雑誌があって、いまそこで連載をしているんだけど、それの次号(4月号)の記事にまとめるために。酷い酷いと言われていたけど、改めて調べてみたら、まぁーやっぱり酷かったね。興味のある方は、そちらを読んでみてください。