自然言語処理と言語学

第2回言語学×自然言語処理合同勉強会に参加するため京都大学へ行ってきた。
全部で3人の発表があり、自然言語処理から1人(松本研yuta-hさん)、言語学から2人だった。

タイトルだけあげておくとこんな感じ↓
・「"意味"を計算機で扱う一方法 ―格解析入門―」
・「誤用と言語変化の可能性 ―Webに見られる『-障り』を中心に―」
・「辞書記述に基づいた定型表現の実態調査」

どの発表もおもしろくて興味深かった。
全部書くと大変なので「誤用」についての話だけ少し感想を書いておく。

web上のデータにはいろいろ誤用(耳障り→耳触り)とか新しい言葉(gdgd、(^^)/)がいろいろ出てきていると思う。誤用の中にはタイピングミスなども含まれていると思うから、一概に誤用かというのは判断しにくいと思う。
自分も変換がめんどくさかったら、候補が一番上にあるものを使ったりする。
まあ、誤用の定義が難しいから何とも言えない。けど、この誤用の定義も時代に合わせて変えていったりしてもいいんではないかと思う。

あとはweb方言とかいう言葉が出て来たが、これは正しいと思う。
gdgdとかwとかはweb上だけで使われるもので、話し言葉では出て来ないしweb方言というのがいいと思う。

言語処理的に見るとこの新しい使われ方をしている単語をどう解釈していくかということが大切だと思う。
今までと違う使われ方をされてしまうと、機械で解釈するのは難しいと思う。
単なる未知語よりも同じ単語で違う使われ方をされるようになった単語が出てくる方が解析結果に影響が出そうだ。

こういったweb上のデータの解析をしていくのも楽しそうだ。


最後に言語処理と言語学に対する自分の考えだけ。
やはり、言語処理をやっている人と言語学をやっている人では考え方が違うと実感することができた。
やりたいことも目標も違うかもしれないけど、やはりどこかに共通する部分もあると思う。
2つの分野で同じゴールを目指す必要はないと思うが、どこで協力しあうことで今までにない新しいものが作りでせるはず。
1から10まで一緒にやる必要はないけど、どこかで協力し合えるような関係であることが望ましいと思う。
そのためには互いに自分のわがままだけ通していてはだめだと思うけど・・・。

なかなか難しいと思うけど、今回のような企画をどんどんしていければいいんじゃないかな。