Dagens Nyheter / Source : Pinterest
おはようございます。酒井です。
今朝は海外の検索系記事から「新聞記事アーカイブ」をご紹介します。
ご紹介したい記事は、こちら。
◆ Newspaper Archives--Google's archive... and beyond
図書館の蔵書アーカイブ化や、特許情報の蓄積などにも積極的なGoogle。
今度は、新聞記事の蓄積に着手したようです。
Google新聞アーカイブのURLはこちら (見たところ、海外紙ばかりです)
◆ http://news.google.com/newspapers
上記の記事では、
・Googleの新聞記事アーカイブは、まだ蓄積途上。検索機能も未完成。
・本文もOCR化が進められているが、エラーを含む。
・しかし、他にはない紙面がコレクションされており、未完成とはいえ、面白い読み物となるだろう
といった紹介がされています。
ベータ版まであと一歩、という感じでしょうか。
実際にアクセスしてみた様子や、
「その他の海外新聞リスト」 などは、記事の続きから。
Googleの新聞アーカイブ。
トップページには紙名がずらり!と並んでいます。
パッと見では 「フランス語の紙名が多いかな?」という印象。
東欧の新聞などもありました。
http://news.google.com/newspapers
逆に・・・
New York Times とか、Guardianとか、USA Todayは収録されていなかったり。
Le Mondeなども1800年代の記事が少し入っているだけだったり。
そんな感じです。
(今後、収録が増えていくのかも?記事中では不明でしたが・・・)
えー。適当に1紙選びまして。
紙名をクリックすると、年代順に紙面イメージが並びます。
画面は左右スクロール形式になっており、年表のよう。
もちろん、紙面イメージを拡大することもできます。
今回、OCR処理が進んでいなかったり、
テキスト検索機能もきちんと実装されていなかったり、と、散々な状態でしたが、
Googleのことですから、
きっと、Google BooksやGoogle Scholarのように、
OCR化して、検索可能にしていく構想と思われます。
その時は、複数の新聞を横断検索できるんじゃないかな?
また、類似画像検索の対象データにもなっていく可能性大、です。
もしそうなったら、
古い製品名などで検索して、製品画像+日付を一挙に入手とか・・・ふふふ。
#これ、公知例探しの事を考えてます。職業病なり。
今後の動向に、注目したいと思います!
----------------------
また、Googleの新聞アーカイブは、まだできたばかり、ということで、
同記事 では、「Wikipediaも情報源としておすすめ」 と紹介されていました。
なんと、新聞記事アーカイブのリストがあるんですよね!
◆ Wikipedia:List of online newspaper archives
こちらには、ちゃんと現代のメジャー誌(?)もあります。
たとえば
New York Times; (→リンク)
(1851–1980) in image and (1980– ) in text
Free 1851–1920 and 1980–present; Pay 1921–1979
ニューヨークタイムズは、古い記事がイメージ。最近の記事はテキストデータ。
1851~1920年と、1980年~は無料。 といった具合。
複数紙の横断検索はできず、
「ニューヨークタイムズ紙のサイトに行って、過去分検索」という形になりますが、
現時点では、こちらの方が情報豊富そうです。
それでは。
アデュー★
別窓で登録フォームが開きます
0 件のコメント:
コメントを投稿