Message to Students【配属を検討しているみなさんへ】

『Tohoku NLP Group の研究室(坂口・乾研, 鈴木研, 松林研) への配属を検討しているみなさんへ』

東北大学の学部3年生、および修士課程・博士課程からの進学を検討している全国のみなさんに向けた文章です。

私たちの研究室では、計算機と数理の力を用いて言語の情報処理に取り組む元気な仲間を募集しています!
これを読んで私たちの研究室に少しでも興味を持ってもらえたなら、ぜひ直接研究室を訪ねてきてください。見学は常時受け入れています。実際に研究室を目で見て、メンバーと話をして、みなさんが充実した時間を過ごせそうか(空気や方針が合っているか)をじっくり確認してください。一同、みなさんとお会いできることを心から楽しみにしています。

学部3年生向け研究室紹介 のページにも関連情報をまとめてあります。

初稿:2018年11月8日
最終更新:2023年9月26日

研究グループのテーマ

そもそも研究室とは何をする場所なのか

研究室紹介に入る前に、みなさんがこれから参加することになる「研究室」が一体どのような組織なのかについて簡単に説明します。大学は研究機関でありまた教育機関でもあります。大学内の組織である研究室でも研究活動とそれを通じた教育活動をおこなっています。

研究活動

研究は、人類にとってまだ分かっていないことについて仮説を立て、検証し、論文化して人類知を更新していく活動です。現在は大学の研究室がその役割の多くを担っています。論文と聞くと大変そうだと思うかもしれませんが、実は世の中の論文というものの多くはみなさんのような学生によって研究室の指導のもとで書かれています。研究室に配属されたみなさんの目下のゴールは、研究をして論文を書くことになります。

ここまでの説明でわかる通り研究と勉強とは全く別の取り組みです。研究室に配属されたら、受験や学部生活でおそらくかなり慣れているであろう勉強とは全く異なる知的生産の技術を短期間で一気に身につける必要があります。これは大変なことで、相応の努力が必要です。しかし十分なサポートを約束します。

教育活動 — 研究を通じて身につけてほしいこと

みなさんは研究という活動を通じて、汎用的な知的生産の方法を訓練していくことになります。研究という総合的で多角的な知的営為は、問題の分解のしかた、調査のしかた、仮説の立てかた、試行錯誤のしかた、議論のしかた、文章の書き方など多くの知的スキルを訓練するためのこれ以上ない練習問題になります。これこそが私たちが提供できる最大の教育だと考えています。ですので、卒業後は研究と無関係の分野に進む予定のみなさんも安心してください。食らいついてきてもらえれば一生使えるノウハウが手に入ります。私たちの研究室は、人を育てノウハウを伝授することに(教育に)大きな重きを置いています。

また同時に、研究という営みを通じて、みなさんがわくわくできる対象、活躍のしかたを明確にしていってほしいと考えています。働きかたはどんどん多様化しています。とくに私たちのいる情報系分野では顕著です。自分の働き方を自分で決めていく必要があります。自分自身の特性が活きる環境と立場を見つけていくためにも、幅広い知的活動を伴う研究という営みを通じて、みなさんの得意不得意や好き嫌いをじっくり見つけていってください。

自然言語処理・計算言語学とは

この研究室では「自然言語処理」「計算言語学」と呼ばれる分野の研究をおこなっています。私たち人間が普段使っている自然言語(日本語や英語)を上手に扱える計算機構(人工知能)を作ること、またこれを通じて言語そのものへの理解を深めることが、われわれの分野の大きな目的です。もっと短い言葉を使うなら「言語データを数理と計算機で扱う」分野です。

言語を扱います

私たちが扱うのは人間が用いる言語です。情報や感情を表現・伝達・記録する媒介であり、抽象化のための道具でもあります。物語も取扱説明書もラブレターも論文も言葉で書かれます。有限の離散的シンボルを並べるだけで、過去一度も表現されなかった全く新しい考えを表現することができます。言葉は今も昔も深淵なトピックです。

言語の数理モデル・計算モデルを考えます

私たちは言語の数理モデル・計算モデルを考えます。つまり、単語や文をどのように計算機で表現し、どのような数理とアルゴリズムで扱うべきかを考えます。機械学習、なかでも最近発展を遂げた深層学習はそうした計算の道具のひとつです。言葉という「文系」的な対象を、数学と計算機という「理系」的な道具で切り取るのがわれわれの研究分野の大きな特徴のひとつです。様々なバックグラウンドをもった人たちが自然言語処理という領域に集まる理由でもあります。

実際の言語データで検証します

私たちは理屈を考えるだけではなく、実際の言語データで検証・実行します。机上で考えるだけではこの研究分野の成果にはなりません。リアルな言語データでの実験が不可欠です。つまり自然言語処理・計算言語学は、理学であると同時にデータサイエンスであり実験科学です。観察と実データでの仮説検証が必要です。巨大なデータを扱うノウハウや計算機実験のノウハウが必要です。こうした力を身につければ研究室を出た後どんな分野に行っても役立ちます。

また現在われわれは膨大な言語データを持っています。ニュース記事、SNSの投稿、小説、議事録、コールセンターのログ、ありとあらゆる言語データが日々生成され蓄積されています。非常に多様でリアルな言語データを実際に扱える時代を私たちは生きています。こうした時代であることが「言語データを数理と計算機で扱う」ことを現実的な営みとしてくれています。

自然言語処理・計算言語学における研究とは

具体的には次のような研究に取り組んでいます。ただしここに挙げたのはあくまでも例です。言語を扱うことなら何でも魅力的な研究テーマになる可能性があります。「こんなことに興味があるのだけど…」と気軽に相談してください。

入出力に言語が関わる広範囲の知的アプリケーションを作る

機械翻訳、対話(チャットボットなど)、質問応答、文書要約、情報抽出、文法誤り訂正など、入出力に言語が関わる知的処理の機構(いわゆる人工知能)を作ることは自然言語処理分野の重要な課題です。近年では、画像キャプション生成など、複数のメディア(たとえば画像と言語)を扱う研究も増えてきました。

言葉の意味の数理モデル・計算モデルを作りタスクを解く

自然言語は計算機にとってはバイト列にすぎません。計算機で言語を扱うためには、言語の意味を計算機でいかに表現するかを考える必要があります。単語や文の意味の表現方法・学習方法の研究(単語ベクトル・文ベクトルなど)、言語が持っている構造の表現方法や学習方法の研究(単語分割、品詞タグ付け、構文解析、述語項構造解析など)は、それ自身が言語への深い理解と洞察を導くだけではなく、先に挙げた様々な応用研究に役立つ基盤技術になっています。

コーパス・タスク・評価尺度を作る

実現したいことや解きたい問題や理解したい現象が解きやすいかたちで世に出回っていなければ、自分たちでコーパス(言語データ)・タスク(問題集)・評価尺度(問題が解けたかどうかの測定基準)を作る必要があります。これも重要な研究です。

自然言語処理・計算言語学という研究分野が今後何をしていくべきなのかを考えるという営みでもあります。たとえば含意関係認識や文章読解と呼ばれるタスクはこうして設計され、いま多くの研究者たちによって盛んに解かれています。

研究グループの特徴

研究のやりかた

研究テーマを自分で作ります

みなさんには研究の一連のプロセスに端から端まで自分で取り組んでもらいます。文献調査や議論を通じて琴線に触れるテーマを探し、研究テーマを言語化し、計画を立て、実験や検証をおこない、論文化する、という活動に自ら取り組んでもらいます。つまり、好きな研究テーマを探せるタイプの研究室です。言い換えれば、研究テーマの候補が与えられるタイプの研究室ではありません。楽しいと思うことに取り組める可能性は高いですが論文にするまでの過程はかなりタフです(代わりにものすごく力がつくことを請け合います)。

研究テーマが見つからない場合でも、1年に2回ほど研究室メンバーがテーマ例を出し合う会が設けられており、その中からみなさんが自分で取り組みたいテーマを選ぶこともできます。

基礎寄りの研究も応用寄りの研究も可能です

実応用に興味のあるかたは直接ソフトウェアやアプリケーションを作る研究ができます。私たちの研究室は多くの企業と共同研究の提携をしており、実社会の課題に直接アタックする機会がたくさんあります。これまで積み重ねられてきた知見が机上の空論ではないこと、実社会で本当に役に立つことがわかるでしょう。

また、企業ではできないような基礎研究・理論研究も多くおこなっています。理屈を考えるのが好きな人、数学が好きな人、基礎的な道具を作るのが好きな人などはこうした基礎研究もできます。多くの問題を一気に解決する可能性のある基礎研究は応用研究とはまた違った魅力があります。

研究以外のアウトプットも推奨しています

研究をして論文を書くのが一番スタンダードな過ごしかたですが、ほかにも様々な可能性があります。それぞれにとって一番楽しくまた活躍できる形が見つかるようサポートします。

実装やプログラミングが好きな人は、実装メインのコンテストに参加したりOSS(オープンソースソフトウェア)の開発をおこなうのも良いでしょう。プログラミングが得意なメンバーは多数在籍しており、充実した議論と訓練の環境があります。自然言語処理技術を用いた実サービスを作って起業するのも魅力的な選択肢です。2018年度はM1の学生2名が起業しました。あるいは組織運営やイベント運営に興味がある人には、学会運営に関わるという選択肢もあります。分野の裾野を広げ大学と企業を繋ぐ仕事は非常に有意義です。私たちの研究室には多くの実績があります。

「頑張る」人が多い場所です

いわゆる「ブラック」な研究室ではありません。土日や夜間に指示が降ってくる、希望しない研究テーマを割り振られる、進捗が出ていないと教員が怒鳴る、といった話は一切ありません。皆が好きなときに休みまた遊びますし、そうした環境を維持しようと努力しています。一方で、研究活動に熱心に取り組んでいる人はかなり多いです。一生懸命頑張ってみたい、人一倍のスキルを身につけたいという人には刺激と学びが多い場所となるでしょう。楽をして良い場所に就職をしようという人にはおそらく合っていないでしょう。就職の斡旋もありません。

周りのメンバーとの関わり

周囲の人と関わることを推奨しています

多くのほかのメンバーと関わることを強く推奨しています。議論を通じ「他人の頭で考える」ことで理解を深め新しい発見をしていってください。これは研究を進める上で大切なプロセスです。個々の研究もチーム戦です。共同作業のうまいやりかたと喜びを見つけてほしいと思っています。それぞれが得意を活かし知恵を出し合うことでことでどれだけ大きなことが成し遂げられるかを実感してください。ぜひ周りの人を助けまた助けられてください。研究室に入ったら、ほかの人に教えられるくらい習熟したトピックをひとつ作ってください。教えあうことが私たちの文化です。教員が学生に「教えて」と言っている現場も度々目にすることになるでしょう。

フラットな組織です

気軽な議論のためにもフラットな組織でありたいと考えています。私たちの研究グループでは教員もスタッフも学生もひとつの部屋に机を並べて研究(や遊び)に取り組める環境があります。気軽に声をかけ合い日常的にたくさん話しましょう。また、研究室では学生から教員へも「坂口さん」「乾さん」「鈴木さん」「松林さん」のように名前で呼んでいます。先生とは呼びません。先生(教える人)と生徒(教わる人)のような固定された間柄ではなく、一緒に共通の問題にチャレンジしていく仲間だと考えているからです。切磋琢磨できる、尊敬しあえる関係性でありたいと考えています。

自律的・互助的な研究会・勉強会があります

定期的に研究会や勉強会をおこなっています。新人の人たち向けには自然言語処理の教科書を読む勉強会とプログラミングの勉強会を提供しており、先輩や教員が学びをサポートします。また、突発的な勉強会の企画も多数あります。研究室に入ったあと足りない部分があれば(たくさんあります)自発的な企画でどんどん良い場所にしていってください。

リソース

分厚い人材リソースを持っています

国内でも最大規模の私たちの研究グループには、多彩なバックグラウンドと専門性を持ったスタッフ・学生がたくさん在籍しています。さらにグループ外の人たちとの交流も大変盛んです。他の研究機関との共同研究、インターンシップ、留学などを強く推奨・サポートしています。つまり、みなさんの興味関心に合ったアドバイザー・メンターを幅広い選択肢の中から見つけてもらうことができます。自由に研究テーマを設定しても大丈夫な理由はここにあります。

研究の進めかたのノウハウを持っています

研究のテーマに関わらず、研究の進めかたにはある程度の共通部分があります。われわれはそうした研究の方法についての汎用的で強力なノウハウを持っています。新しいやりかたを見つけて互いに共有する文化があります。
参考まで、こちらのページには国内の大学・研究所の自然言語処理分野の業績が載っています(私たちは理研と東北大合同の研究グループです。ACL・EMNLP・NAACLといった最も権威のある国際会議での業績に応じた得点が載っています)。

潤沢な予算があります

研究をおこなうための資金についても心配無用です。大規模計算を実行するためのサーバー費用や、研究成果を国内外の学会で発表するための旅費に関して、基本的に困ることはないと思ってもらって大丈夫です。
また博士進学者向けには、学振などの若手向け研究予算獲得のための指導もおこなっています。中長期的な研究計画の立て方や、説得力のある研究プロポーザルの書き方を学ぶことができます。

参考「Research Grant / 研究助成」のページ

求める人材

トピックへの興味はあるけれどやりかたがわからない人

自然言語処理に関わるトピックへの強い興味はあるけれどやりかたがよくわからない人にとってこの研究グループはきっと楽しい環境です。「音楽に興味があるので歌詞の研究をしたい」「方言を上手に扱える人工知能を作りたい」「巨大な離散データの機械学習に取り組んでみたい」「物語について数理的に解析してみたい」といった興味の種を、幅広いバックグラウンドを持った研究グループのメンバーと一緒に具体的な研究に落とし込んでいくことができます。

具体的なやりたいことはないけれど最先端の環境で頑張ってみたい人

具体的にやりたいことがなくても大きな問題はありません。研究室に入ったあと、定期的な研究会や日常的な議論を通じて非常に多くのトピックに触れることになります。その中からみなさんの琴線に触れるトピックを見つけ、研究という新しい知的体験自体を楽しんでください。もし人一倍のやる気と知的好奇心があり、新しい知識と技術を身につける努力それ自体を楽しめる人なら、この研究グループでの生活を存分に楽しめるでしょう。

自ら動ける人・自らコミュニケーションを取れる人

この研究グループでは、自分から勝手に動く人(どんどん相談する人、試してみる人)には無尽蔵にサポートと機会提供があります。「やりたい」と自分から口に出しさえすれば、動きさえすればなんでもできます。議論・相談はもちろん常時多くの人が受け付けていますし、インターン・留学・共同研究や学会参加のサポート、面白い共同研究案件の紹介から外部の研究者とのコネクションの提供まで、非常に幅広い支援をおこなっています。それを実現できる潤沢なリソースもあります。元気な人、自分から動き変化を生むことが好きな人、積極的なコミュニケーションが得意な人にとってこの研究グループはかなり合っているでしょう。

一方で、マイクロマネジメントはほとんどおこなわれず、いわゆる放置系の研究室でもあります。自分から周りの人に話しかけたり手をあげたりするのが苦手なタイプの場合、研究室生活を通した成長はあまり多くはならない可能性があります。

答えのない世界でもがける人

誰も答えを知らない状態での試行錯誤が苦にならない人や、失敗し続けることを楽しめる人はこの研究グループにかなり向いています。この研究グループでは全員がいちから研究をします。実験をはじめる前に何ヶ月もの議論が必要となることはしばしばですし、ほとんどすべての実験は失敗に終わります。先輩や教員も一緒に考えますが、答えを教えてくれる人はいません。答えを知っている人がまだ居ないからこそ研究になるわけです。仕事をはじめたあと直面する問題もこうした正解のない問題です。研究室という環境で、一生使える試行錯誤と問題解決のスキルを身につけてほしいと願っています。

研究室の決めかた

研究室の決めかたについて簡単に触れておきます。

研究室配属は重要なライフイベントです

まずはじめに、研究室配属は非常に重要なライフイベントです。

研究室生活で身につく力は一生ものです

数年間の研究室生活で得た力は一生の糧になります。研究し論文を書くというおそらくはじめての経験を通じて、汎用的な知的生産のノウハウを身につけてもらいたいと強く願っています。最先端の知見を得る興奮を知ってほしいと思います。また、自分を駆り立てる対象、取り組みかた、チームプレーがどのようなものなのかを見つけてほしいと考えています。

研究室が生活の基盤になります

研究室に配属されたあとの数年間、みなさんは研究室という小さなコミュニティで、研究室のメンバーと密に関わりながらたくさんの時間を過ごすことになります。多くの人はB4からM2の3年間、博士課程に進学すればそれ以上。若いみなさんにとって長く貴重な時間です。研究は相談しなければ進みませんし、研究活動はチーム戦です。他の人と関わらずに黙々と過ごすのは困難です。他者との上手な協力のしかたを学び、それを楽しんでもらいたいと考えています。

十分な情報収集をして相性の良い研究室を探してください

したがって、どの研究室に行くかという意思決定はみなさんの人生やこれからの生活に関わる重要事項です。また、合う合わないは非常に大事です。 みなさんにも経験があると思いますが、自分自身に合った組織に入れば大きな成長と充実した時間が待っています。「良い研究室に行く」ことを目指すのではなく「合った研究室に行く」ことを最優先に検討してください。進学先の大学を決めたときのように、入るサークルを決めたときのように、働く会社や機関を決めるときのように、慎重に大切に意思決定をしてください。

研究室の決めかたのアドバイス

自分に合った研究室を見つけるための一般的なアドバイスを書いておきます。

1. 自分を知ろう

みなさんの「楽しい」「輝ける」「成長できる」のポイントをこの機会にぜひ言語化しましょう。学部の講義や書籍で出会ったトピックの中で特にワクワクしたものは何ですか? 惹かれる研究テーマは何ですか? それのどこが特に面白いと感じますか? 過去、どんな瞬間が楽しかったですか? じっくり新しいものごとを考えているときですか? 誰かと議論しているときですか? 何かを作っているときですか? 自由な裁量を与えられて自分で物事を決められるときにやりがいを感じますか? それとも丁寧な指導やサポートを受けられているときの方が居心地が良いですか? 過去、周りの人からどのような点についてポジティブなフィードバックを受けてきたでしょうか。何を褒められ、喜ばれ、認められてきたでしょうか。周囲の話はさておき、自分は何が好きで何が得意で何に喜びを感じる人間なのかという観点こそが研究室を決めるための軸になります。

2. 研究室を知ろう

各研究室の特色を知ってください。研究トピックと、研究スタイルと、研究室の雰囲気を知ってください。東北大学のみなさんは3年次の研究室見学会を活用してください。毎年のオープンキャンパスではデモと説明会を行なっています。個人での研究室見学にもいつでも遠慮なく来てください、心から歓迎します。実際に教授陣・スタッフ・学生とたくさん話してください。「あ、この人たちと過ごしたい」と感じるかどうかは大変重要です。ほかの研究室のことも知ってください。研究室を見たい、話を聞きたいと相談して断るような先生はいません。

3. 自分にマッチした研究室を選ぼう

十分に比較した上で、もしみなさんとこの研究室が合いそうでしたら。Welcome!! ぜひ一緒に活動しましょう! お会いできることを楽しみにしています。

研究トピック、研究スタイル、研究室の雰囲気といった様々な観点のうち、みなさんにとって大切な軸で色々な研究室を比較してください。「ホワイト」「ブラック」といった情報や耳当たりの良いキーワードに惑わされないでください。 たとえば私たちの研究室にはコアタイムがありません。「ホワイト」でしょうか?それはわかりません。たとえば土日や深夜を含めて好きな時間に活動したい人には良い環境でしょう。一方で、怠けがちなので時間割がある方が動きやすいという人はコアタイムのある研究室の方が間違いなく幸せになれる筈です。全員が幸せになれる理想の研究室は存在しません。自分を知り、研究室を知り、皆さんに合った場所を探してください。

補足:成績で決めることは全くお勧めしません

東北大の学生のみなさんへ:成績で所属研究室を決めるのは全くお勧めしません。成績の高さと研究室との相性の良さ、その研究室で活躍できるかは全くの別問題です。相性の方が何倍も何倍も重要です。そもそも勉強と研究は別の活動です。試験で高い点数を取るのが得意なことと面白い研究ができることは無関係です。

念の為、これまで勉強してきたことは研究にものすごく役立ちます。その内容のみならず、複雑な概念を理解する力も努力する力も研究に大いに役立ちます。また、研究室配属後も、就職してからも、一生勉強は続きます。ですから、これまで勉強を頑張ってきたみなさんは誇りを持ってください。これからの研究活動で大いに活きるでしょう。そうでなかった人はこれから頑張れば大丈夫です。

FAQ

必要なスキル

プログラミング能力はどの程度必要ですか?

全員必ず使うことになりますが、入ってから訓練すれば大丈夫です。好きな人・得意な人はそれが強力な武器になります。

数学力はどの程度必要ですか?

全員必ず使うことになりますが、入ってから訓練すれば大丈夫です。好きな人・得意な人はそれが強力な武器になります。

英語力はどの程度必要ですか?

全員必ず使うことになりますが、入ってから訓練すれば大丈夫です。好きな人・得意な人はそれが強力な武器になります。

進路

就職
ここまでに書いた通り、配属されれば何もしなくても自動的に業績が手に入り良い就職先に斡旋してもらえるというタイプの研究グループではありません。その代わり、研究活動を積極的に頑張った人は、自然言語処理の専門知識・専門能力のみならず強い問題解決力が確実に身につきます。得られるスキルセットは非常に強力かつ競争的で、就職活動でも全く困りません。

卒業生の主な就職先は 学部3年生向け研究室紹介 を参考にしてください。

博士進学

おすすめしています。一段のスキルアップが見込め、就職先も研究機関含め魅力的な選択肢が増えます。

Last-modified: 2023-09-26 (Tue) 15:00:21 (175d)

Recent Changes
Close