Tips

https://okuno.co のおまけ.ときどき更新の予定で,順番などはてきとう. 数理統計~機械学習村のならわしに準拠しており,主に国際会議論文投稿に関するTipsを扱います.要望などありましたら直接お問い合わせください.

目次

A 研究テーマを決める
  1. A-1 国際会議論文を探す
B 発表する
  1. B-1 発表スライドを作る
  2. B-2 画像にモザイクをかける
C 論文を書く
  1. C-1 Overleafで日本語を使う
  2. C-2 書誌情報 (.bib) を探す
  3. C-3 英文を(自分で)校正する
  4. C-4 LaTeXのコメントを一気に消す
  5. C-5 Domain Conflictsの入力


A-1 国際会議論文を探す

[会議の名前を知る]~[Proceedingsを探す] は,論文を探すための最初のキーワードが分からず困っている学部4年生または修士1年生を対象にしています. 検索したいキーワードが既に分かっている場合は [Google Scholarで探す (キーワード検索)] まで飛んでください.

A-1-1 会議の名前を知る

神嶌先生のwebページにあるpdf (http://www.kamishima.net/archive/MLDMAImap.pdf) を見ると分野ごとの有力な国際会議が分かります. 自分は統計的機械学習が好きなので,良く読むのはLearning Theory, Machine Learning, Artificial Intelligenceに該当するICML, NeurIPS, AISTATS, IJCAI, AAAI, ICLRなどです. 画像処理 (Computer Vision; CV) を専門にしている人はICCV, CVPR, ECCV, ICPRなどを読むでしょうし 自然言語処理 (Natural Language Processing; NLP) の人はACL, EMNLP, NAACLなどを読むのだろうと思います.

A-1-2 会議のレベルを知る

CORE Portalで会議のレベル (Rank) が検索できます. 一概には言えませんが,一般的にはRankの高い会議ほど査読が厳しく良い論文の割合が多いとされています. 例えば機械学習のトップ会議であるICML (International Conference on Machine Learning) を検索してみると
CORE
となりRankがA*と分かります.A*,A,B,Cの順でRankが下がり, A*とAが「トップカンファレンス」と呼ばれる一群,Bが「2nd tier」,Cがそれ以下です. 基本的にはA*とAを読めばよく,Bまでは許容範囲ですが,C以下になると査読が全く機能していない論文の割合が大幅に増えますので,できれば避けたほうが良いでしょう. 私は上記のCORE PortalGuide2Researchをよく参考にしていますが, 難易度は毎年変わりますし,分野や母集団が異なると単純に比較できるものでもないので,あくまで目安として使ってください.

A-1-3 Proceedingsを探す

良さげな国際会議が見つかったら,次はProceedingsを探してみましょう. Proceedingsとは論文のまとめ集のようなものです. 例えばGoogleなどで"ICML proceedings"と検索してみると,
GoogleProceedings
Proceedings of Machine Learning Research (PMLR)のぺージが出てきます. PMLRのページを開くとVol. 97がICML2019の特集になっているので,リンクをクリックすると論文の一覧が表示されます.
PMLR_vol97
タイトルと著者名が表示されています. この中で興味を惹くタイトルがあれば [Download PDF] を押すと論文が表示されます.適宜ダウンロードして読みましょう. Proceedingsは会議ごとに発行する場所が違う場合があり,また一部の会議論文は無料で読めない場合もありますので注意してください.

A-1-4 Google Scholarで探す (キーワード検索)

ある程度研究のキーワードが分かってくると, 論文検索に特化したGoogle scholar (https://scholar.google.com) を使って論文をキーワード検索することもできます. 例えば"autoencoder homology"の2つのキーワードを入れて検索してみると
GooglScholar
関連した論文が表示されました.リンクをクリックすることで当該ページに飛ぶことができますし, 右側に[PDF]が表示されている場合は直接pdfをダウンロードできることもあります. 私の指導教員の下平先生が書かれたブログ記事も参考になります.


B-1 発表スライドを作る

発表スライドを作るときよく使われるのはPowerpoint, Keynote, Beamerなどです. Powerpointは図を入れやすいが綺麗な数式を入れにくく, Beamerは数式を入れやすいが図を入れにくい気がします.用途に応じて使い分けましょう. スライドデザインについては,たとえば書籍 [学生・研究者のための使える!PowerPointスライドデザイン 伝わるプレゼン1つの原理と3つの技術] などを参考にしてください. 数冊購入していただきましたので,下平研の本棚に置いてあります.その他にも [伝わるデザイン] などのwebページが役に立ちます.

B-1-1 守るべき3つのポイント

発表内容を充実させるのはもちろんのこと,ここでは忘れがちな,発表で守るべき3つのポイント: (1) タイトルに情報を詰め込む, (2) ページ番号を記入する, (3) 参考文献をきちんと引用する, について紹介します.

(1) タイトルに情報を詰め込む
タイトルページには発表タイトル・自分の名前・日付と発表場所 を入れましょう.
slide_1
このスライドには載せていませんが,2行程度の簡単な概要などを書いても良いかもしれません.論文紹介の場合は,タイトルページに紹介する論文の文献情報を書くとよいです.

(2) ページ番号を記入する + (3) 参考文献をきちんと引用する
スライドにはページ番号を入れましょう.ページ番号を入れていないと,発表についてのコメントを受ける際にどのページを開けばよいか分からず困ることになります. また,スライドで既存の定理や概念を利用する場合には必ず引用情報を記述しましょう.基本的には「その概念を提案したオリジナルの論文」を引用すべきですが,よく知られた一般的な概念であれば最近の教科書やサーベイ論文などを引用する場合もあります.発表時に説明しきれなかった場合,当該論文にさかのぼり主張が正しいかどうかその場で検証が行われることもありますので,「どこの文献を見て書いたのか」をきちんと書いておきましょう.
slide_2
発表スライドの最後には参考文献の一覧を載せます.引用した文献を全て載せるようにしましょう.
slide_3
引用情報は,たとえば [3-1 Google Scholarから探す] で紹介したようにGoogle scholarで論文検索し,ダブルクオーテーションマークを押して出てくる書誌情報(「引用」)からコピーするとよいです.APA/MLAなど様々な引用方式がありますがどれを使えばよいかは場合に依っていて,研究室内の発表では,一貫したフォーマットを利用する限りどれを使っても問題ありません.私は基本的にはAPAのフォーマットを使っています.

B-1-2 pdf化する

現在,多くの学術機関においてファイルの標準的なフォーマットは .pdfです.論文もpdfで配布されるし,多くのスライドもpdfで配布されています. またPowerpointやKeynoteは有料のソフトウェアですから,ソフトを所有していない人はファイルを開くことができず,ファイルを配布する際に固有の拡張子 .pptxなどとするのは好ましくありません. .pptxファイルは文字の配置などが実行環境に依存するので,Macで作成したファイルをWindowsで開くと大きく文字化けしたり,位置がずれてしまう問題もあります.したがって,多数の人が閲覧する研究室のslackやgoogle driveにファイルをアップロードする場合は, [PowerPointファイルをPDF形式に変換する2つの方法] などを参考にして,必ず .pdfに変換してください.アニメーションを利用する場合は,pdfでアニメーションが消えた場合でも正しく意味が通るように注意してください.(なお,私はスライドでアニメーションを使いません)


B-2 画像にモザイクをかける

資料のweb公開時や対外的な発表時に,一部画像をお見せできない場合などがあり,その場合は黒で塗りつぶすか,画像にモザイクをかけたりして対応します.以下ではWindowsでは標準的にインストールされているペイントでモザイクをかける方法を紹介します. なお,この記事ではいらすとや徳川家康の似顔絵イラストを利用しました.

モザイクをかけたい画像をペイントで開きます.
開く

次にモザイクをかけたい部分を「選択」します.
選択

「選択」した四角形の右端の四角を左上にドラッグして, 小さな正方形まで縮小します.
縮小

ドラッグ状態をやめ(縮小した状態でマウスから指を離す)て, 再び右下の四角をドラッグして引き延ばします.
モザイク
これでモザイクがかかりました.


C-1 Overleafで日本語を使う

Overleafはデフォルトでは日本語を出力してくれませんが .texファイルのPreamble部 ( documentclassのすぐ下で usepackageを書くところ) に usepackage[whole]{bxcjkjatype}と書くだけで日本語が出力されるようになります.
LaTeX-CJK https://texwiki.texjp.org/LaTeX-CJK


C-2 書誌情報 (.bib) を探す

C-2-1 Google Scholarから探す

書誌情報を探すとき一番手っ取り早いのは Google scholar (https://scholar.google.com) を使う方法です. キーワード検索などをして論文を探すと,各論文の左下にダブルクオーテーションマークが出ます.
bibtex1
ここを押すと以下のように書誌情報が表示されます.
bibtex2
この中でBibTeXと書かれた部分を押すと,bib情報が表示されます.
bibtex3
コピペして使いましょう. 一方で,Googleは様々なwebページの情報をもとに書誌情報を自動生成しているようで, 表示される書誌情報がおかしいことが多々あります.目視で確認して手動で修正するなど注意して使いましょう.

C-2-2 Proceedingsから探す

[A-1-3 Proceedingsを探す] で紹介したようにProceedingsから論文を探した場合は, 各論文のAbstractのページに飛ぶとBibTeXの情報が公開されている場合があります.
bibtex_proceedings
Proceedingsなどに表示されているBibTeXは公式で精度が高いので,Google Scholarよりもこちらを優先して使いましょう.論文の著者が個人ページでbib情報を公開している場合もあります.


C-3 英文を(自分で)校正する

英語を生業とするならいざ知らず,我々は(主に)数学や情報を専門とする人間であって,足りない英語力を文明の利器で補いながらどうにかして英文を捻りだし,校正して出版までもっていく必要があります. ここでは主にGoogle scholarとThesaurusを利用した,最低限知っておくべき小手先の校正テクニックついて説明します.

C-3-1 文章のパターンマッチング

英語論文を書く上で最も重要となるのはGoogle scholar (https://scholar.google.co.jp/) によるパターンマッチングです.ここでパターンマッチングはダブルクオーテーションマークで文章を挟んだ"(文章)"での検索を指します. たとえば,「ある可視化されたデータが3つのグループに分かれた」という状況を説明するとき,"the visualization were separated"という文章を書いたとします.Google scholarでパターンマッチングした結果は
pattern_match_1_1
となり,論文では全く使われていない用法であることが分かります.ここで例えば"visualization"を"images"に変更してみると,
pattern_match_1_2
であり,何やら"the images were separated into *** groups"のように書かれた文章が出てきました.先ほどの文章は既存の論文では全く使われていない言い回しだったようですから,変更した文章は以前のものよりは良いであろう,ということになります. この文章もヒット件数は500程度しかなく,あまり信用がおけるとは思えませんが 手を変え品を変えて言い回しを工夫しながらGoogle scholarのパターンマッチングを繰り返し,同様の意味で使われている論文が多くなるような言い回しを探せば,そこまで変な英文を書くことは少なくなるでしょう. 言い回しを工夫するためThesaurusを利用する方法は [C-3-2 類語を探す] で紹介します.

情報処理の基礎を学んだことのある方はご存知かと思いますが,ワイルドカードの記号 * は,当該箇所に任意の文字列を勝手にパターンマッチしてくれます.たとえば"we aim"という語を使い,「我々は~~を減らしたい」という文章を書きたいのだけれども続く前置詞が分からない,といった場合には,"we aim * reducing"のように検索すれば
pattern_match_2
当該箇所を補間した文章が検索されます.上位3つの文章では"we aim at reducing"がヒットしていますから,atを入れればよいことが分かります.この用法は特に前置詞が分からない場合などに便利ですが,フレーズの検索時に固有名詞を無視したいとか,色々なことに応用できるので覚えておいて損はないでしょう. なお,本節の内容は [C-3-3 参考になる本など] で紹介するGoogle 英文ライティングの本にも詳しくまとまっています.

C-3-2 類語を探す

類語辞典(Thesaurus)を利用すれば単語の言い換えをいくらか検索することができます. 私がよく利用するのはThesaurus.com (https://www.thesaurus.com/) です.たとえば"tell"を検索してみると,
thesaurus_2
のように同様の意味で異なる単語がたくさんヒットしますから,同様にして文章中の各単語をより良い単語に置き換えましょう. 文章中の単語をThesaurusで書き換えて,[C-3-1 文章のパターンマッチング] で紹介したようにGoogle scholarでパターンマッチングする,という操作を繰り返し満足いく文章まで到達できれば(セルフ)英文校正の完了です.

C-3-3 参考になる本など

巷には,英語論文の書き方についてまとめた本がたくさん売られています. どれを買ってよいか迷うほどです.参考までに私が良かったと思う本をいくつか紹介します.まず私が全員におススメしているのは

  • 小野義正 (2016). ポイントで学ぶ科学英語論文の書き方 改訂版. 丸善出版. [Link]

です.1500円程度で購入できる160pほどの薄い本ですが,英語論文を書く上での作法などが必要最小限でまとまっており,英語論文執筆が決まればまず一冊購入して読むべきかと思います.その次にお勧めするのは

  • 遠田和子 (2013). Google英文ライティング 英語がどんどん書けるようになる本. 講談社. [Link]

です.こちらは [C-3-1 文章のパターンマッチング] で紹介したテクニックをより詳細にまとめた本になっています.以上が(現代的に)英語論文を書く上で最低限読んでおくべき2冊かと思います.ここに付け加えるならば,英文を書くときにパラパラと参考にできる本として,シチュエーションごとの英語表現と重要動詞をリストして詳解した

  • 小田麻里子,味園真紀 (1999). 英語論文すぐに使える表現集. ベレ出版. [Link]
  • 原田 豊太郎 (2015). 理系のための英語最重要「キー動詞」43. 講談社. [Link]

の2冊かと思います. 500p以上ありまだ私自身ほとんど目を通せていませんが,2019年末に和訳が出版された

  • エイドリアン・ウォールワーク著,前平謙二,笠川梢訳 (2019). ネイティブが教える 日本人研究者のための論文の書き方・アクセプト術. 講談社. [Link]

なども英文ライティングの定番として評価が高いようです.通しで読むには分量が多く,内容も細かいようですから,他の本を読み何本か論文を書いた後で読むのが良いかと思います.なお原著のUseful PhrasesセクションがSpringerで無料公開(*pdf注意)されており,大変参考になります.ある程度英語が苦にならなければ,英語でのフレーズ集や,そのDiscussionなども検索して参考にすればよいでしょう. その他にもたくさんの本が出版されていますから,Amazonで検索するなどして良い本を探しましょう.


C-4 LaTeXのコメントを一気に消す

まずPerl (*プログラム言語)をダウンロードしてインストールする.たとえばこういうwebページが参考になる.installが終わればperlを起動する.たとえばwindows環境下であれば,プログラムメニューで「perl」と入力すればperl (command line)などが出てくるはず. 処理したいファイル(.tex)があるフォルダに移動し,latexpand (https://gitlab.com/latexpand/latexpand)からダウンロードした「latexpand」というファイルを入れる. コマンドラインでも当該フォルダに移動したあと,latexpand (処理したいファイル名).tex > (処理後のファイル名).tex と入力し実行すれば,コメントを消去したファイルが当該フォルダに出力される.


C-5 Domain Conflictsの入力

Microsoft CMTなどで論文を投稿しようとすると,Domain Conflictsを入力せよと指示が出ることがあります.
domain_conflicts
(他にも様々な理由があるだろうと思いますが) 同じ組織に属する人にレビューなどが回り利益相反を起こさないためのシステムのようです. 基本的には現在の所属のドメイン,つまり所属先のメールアドレスの@マーク以降を入力すれば良いです. 例えば京大の情報科であればi.kyoto-u.ac.jpと入力します.CMTのInstructionにもありますように,gmailなど組織に関係ない一般のメールプロバイダのドメインを入力することは避けましょう. なお,少し検索してみるとICCV2013のようにconflict domainの入力について細かく規定している場合があります.投稿先の規定をよく読みましょう.

リンク集

参考文献

今後何か追加するかも