d.y.d.論文を読もう
論文というのは、非研究者にとっては、なんかラノベとか漫画とかそういうカテゴリのものであって欲しいと思う。
論文というと、難しい専門知識が綴られていて、その勉強のために読むもの、というイメージが、 もしかしたら、あるかもしれません。 しかし世の中には論文読みが趣味という人がいて、そういう人はどちらかというと、 ちょっと面白い小話を読んで時間をつぶすためであったり、 華麗な技法や証明の紹介を読んで胸躍らせるエンターテイメントとしてであったり、 読んだ2分後に忘れててもいいから楽しい時間を過ごそう、くらいの気分で読んでいたりします。 いや、2分後に忘れてていいなどと思ってるのは私だけかも知れませんが…。
というわけで、そんな風にみんなが漫画読む気分で論文読む世界を目指すべく、 そもそも論文ってどんな感じに見つけたり探したりするのかというお話です。 あ、基本的にコンピュータ科学系の英語論文が対象です。
最初の一本に出会う
まず最初に一つ、「面白いな」と思える論文に出会うと、そこを足がかりにすることができます。 最初は、まあ、運で、
- Twitter を眺めていたら 「この論文のイントロが面白すぎる (43RT)」 なんてのが流れてた
- 技術用語でふつーにGoogleなどで検索していたら論文のPDFが引っかかる
くらいでしょうか。 論文に特化した検索エンジン(Microsoft Academic Search や Google scholar)もあって、年度を区切って検索する、 引用数などの論文の重要度の指標を参照できる、など色々な機能もありますが、 科学史上の重要性とか気にして論文読んで何が面白いんだ、と私などは思ってしまいますので、 ごく普通の検索エンジンで普通に検索するので十分なんじゃないでしょうか。
良くみかけるドメイン
検索でヒットする論文の載ってるサイトは、研究者の個人ページを除くと、 いくつかの出版社などのサイトに限られています。 ラノベでいうとレーベルがいくつかあるみたいなものだと思います(適当)。 以下にに、自分がよく当たるベスト6の概要を簡単にまとめました。
acm.org と ieee.org には、 それぞれ、コンピュータ科学の二大学会である ACM と IEEE から出版された論文が掲載されています。 これらの学会の主催する国際会議の発表論文集や、定期刊行の論文誌の論文などがあります。 springerlink.com は、 有名な “Lecture Note in Computer Science” シリーズを擁する Springer 社から出版された論文が見つかります。 ACM/IEEE 主催でない会議は、その発表論文集をこのLNCSシリーズで刊行することが非常に多く、 かなり多数の会議論文が springer から出ています。 sciencedirect.com は、多数の論文誌を抱える Elsevier 社のサイトで、ページ制限のある会議論文と違って全ての詳細まできっちり書き込まれた論文誌の論文が、 多く置かれています。 (※注: 逆にSpringerに論文誌もありますし、Elsevierの出す会議録もありますが、 なんとなく私が出会う論文の傾向としてはこういうイメージ…)
この4つを始めとする出版社系サイトの論文は、基本的に、有料です。 ですが、大学生の人は、もし大学が一括で契約を結んでいれば、大学のIPからアクセスすれば無料で見られるか、 大学図書館のプロキシを通すと無料で見られる、という状態になっていることがあります。 家で見つけた論文が読めない~と思っても諦めずに、大学から再挑戦してみたり、 大学図書館のページをチェックしてみるのはお勧めです。 自分はこれを知らずに学部生の頃は諦めまくっていて勿体なかったです。
また、最近は 「著者が自分のページで原稿を公開するのは自由」 という契約で論文が出版されていることがほとんどなので、 多くの研究者が、自分のページでPDFを公開しています。 読みたい論文を見つけたら著者名で検索してみて個人サイトを探すのは有効な手段です。
citeseer は、そういった、 著者が公開している場合など Web 上に無料公開されている論文をクロールして整理している検索エンジンです。 しかしどちらかというと、citeseer 自体を使って論文を探すというよりは、 「他の検索エンジンで探したとき元ページより上にランキングされるので見てしまう」 「元ページが消えてもPDFなどをキャッシュしていたり、ps形式をPDF形式に変換してくれていたりするので便利」 な論文キャッシュサーバとして活用してしまっているかも…。
arxiv.org は、preprint server と呼ばれる、 著者が自分のバージョンの論文を公開する場を提供するサービスです。 出版された論文の「自分で公開するのは自由」用置き場として使われていることもあれば、 もっと早く、会議や論文誌への提出前のアイデアメモみたいな、 段階からの意見交換のためにアップロードされているようなPDFもあれば、色々です。 個人サイトと違って統一された体裁なので、 知らないと出版社サイトのもののように権威のある査読を通った論文と勘違いされてしまうこともあるみたいなんですが、 arxivは誰でも好きにアカウントを取って自分の論文をアップロードできる場所です。 なので、P=NP予想を解いたと主張する論文?などは大抵ここに載ってます。 といっても、決して逆の勘違いもしないで下さい。決してトンデモ論文置き場ではありません。 コンピュータ科学の中だと、特に暗号や計算量理論の方面ではpreprint serverの活用が盛んで、 多くの第一線級の論文がarXivで公開されています。 国際会議のトップページで、”ページ数制限のないフルバージョンをarxiv等に投稿することを強く推奨” といった文言を見かけることもあります。
次の一本
一つ「面白いな」と思う論文に出会ったら、そこを足がかりに色々探すことができます。 私の場合2通りの方向を探しています。
- 作者買い: 同じ著者の書いた別の論文を探して読んでみます。 面白い論文を1本書く人をみたら100本書いてると思え、って、それじゃゴキブリみたいですが、 間違ってはいないと思います。例えば私は Conor McBride や Thomas Colcombet のファンなので、新刊を書かさずチェックして追っかけていますが、いつも面白いです。
- 会議・論文誌買い: 面白いなと思った論文が、どの会議で発表されたものか、 どの論文誌に出たものかをチェックして、その会議/論文誌の他の論文も探してみます。 これも、自分の面白いと思った分野の他の研究が色々見つかってお得です。
これも著者名や会議名で普通の検索エンジンで検索するとだいたい十分ですが、 DBLP という論文データベースサイトがあるので、ここを目掛けて探すのも、かなりお勧めです。 例えば、 Knuth先生の論文一覧 や CIAAという会議の2011年の論文一覧 などなどが見られます。
継続的に
書評サイト、感想サイトを巡って面白い本を探すように、 定期的に面白い論文を紹介してくれるブログ等をチェックするのも手ですね。 プログラミング言語の話なら Lambda the Ultimate は外せません。 理論計算機科学だと、 Theory of Computing Blog Aggregator という記事のaggregatorを見ていると面白いそうです。結構流量が多くて大変なので、 私は、その中でお気に入りの Gödel’s Lost Letter and P=NP というブログだけは欠かさず読むようにしています。
また、今年は 今年読んだ面白CS論文紹介カレンダー というのが12月14日から始まるそうなので、 要チェックです!