勉強会

MTとS&D(意味談話)の勉強会に出る。
MTはkatsuhiko-hさんがKoehnの「Statistical Machine Translation」の11章Tree-Based Modelsの後半を読んでくれた(前半は先週やりました)。
正直いって1回本を読んだからといって全て理解できるわけもないので、復習やら論文やらをよんで理解する必要があるな〜と感じた。
先週、katsuhiko-hさんがTree-Based関連の論文で読んでおいたいい論文を4つ教えてくれたのであげておく。

  • Forest Rescoring: Faster Decoding with Integrated Language Models. Liang Huang, David Chiang. ACL2007. pdf
  • Statistical Syntax-Directed Translation with Extended Domain of Locality. Liang Huang, Kevin Knight, Aravind Joshi. AMTA2006. pdf
  • Scalable Inference and Training of Context-Rich Syntactic Translation Models. Michel Galley, JonathanGraehl,KevinKnight ,DanielMarcu , Steve DeNeefe , Wei Wang, Ignacio Thayer. ACL2006. pdf
  • Efficient Multi-pass Decoding for Synchronous Context Free Grammars. Hao Zhang, Daniel Gildea. ACL2008. pdf

S&Dでは@otoritoriが"Sentiment Analysis of Twitter Data, ACL2011"を紹介してくれた。
自分がやっている研究とはあまり関係ないように思ったが、なかなか興味深い内容だった。
少し話は変わるが、@pavlocatが株価情報をクロールしてくるプログラムを早速書いていた。仕事早すぎ笑 自分の研究は進んでいるのか?っといいつつ自分も他人のテストデータを作成していて、ようやく終了したが。。(500文くらい余裕かと思っていたが、かなり大変な作業だった。でも、いろいろな特徴もわかったのでやって損はないし、データを見るのはおもしろい!)
あとは本人がAPIを使いこなすだけですね〜。