sort -tでTAB
あるデータをsortコマンドを使って、上手くいかなかった。。
データはこんな感じで
単語 TAB 頻度
みたいになっている。
sortコマンド使ってこのTABの後ろの頻度順にソートしたいのに、
sort -t \t -k2 text.txt
としても上手くソートできず。
ネットで調べるとタブはTABキーを押してそのまま入力しないいけないらしいけど、TABキーを押すと入力補完に。。
これを解決するにはCntl + v で入力モードを切り替えないといけないらしい。
今まで知らなかった。。。
あとはbashrcとかに
alias sort='sort -t "TAB"'
とかしといても大丈夫らしい。(TABはキーボードから入力したもの)
ちょっとだけ今日のまとめ。
お昼は駄菓子屋というところで天丼定食を食べる。
ご飯大盛りにすると結構量が多くて苦しかった。
@nokunoさんは見事に半分くらいご飯を残していました*1。
スライム肉まんが今日から発売ということで買ってしまった。。
意外にかわいい。(スライム肉まんが"食べてほし"そうにこちらを見ているといった感じ)
@Isinfoinoくんは食欲減衰カラーとか言ってバカにしていたが、やはり好奇心には負けてしまうのが人間ではないだろうか。
食べてみると味は案外普通で、中はこんな感じ。
言語教育勉強会は@northbehindさんのもくじ発表や@shirayuさん、@tkyf_7の進捗〜。
どれもおもしろかったが、一番はやはり一緒にミーティングとかしている@tkyf_7くんの進捗。
いろいろと意見が交わされていたが、遠い人の声は全然聞こえないしやっぱりskypeで勉強会はいろいろと不便。
いつもやっていたO山さんがすごいと思う。
*1:おそらく普通でも残してます笑
つくばD飲み
21日から某Y社でインターンシップということで東京へ。
朝早くてどうしようかと思っていたが@mamorukさんが高の原まで送ってくれたので助かった。
感謝です。
京都からは前回と同じく「ぷらっとこだま」を使う。
お昼は京田舎弁当。
東京着いて、いったんマンスリーマンションに行って荷物を置きに行く。
そして、その後「つくばD飲み」なるものに参加するためにつくばへ。
3年ぶりにつくばに来たが遠い。。
「つくばD飲み」分かっていたけどかなりアウェー。。
メニューはよくわからんし。。
まあ、それも最初だけで飲み始めたら関係なくなるけど笑
誰一人として実際に会ったことのある人がいなくてもなんとかなった。。
@syou6162と一緒に授業受けてたという人もいて世間はせまいな〜と思った。
big_2ndくんはかなりいろいろとやっているようで、話を聞いているとおもしろかった。
@miqueさんと少しだけ某面接の話をしたりもできて良かった。
そして幹事の@_3mameさんはテンションやばかった!いろいろと。翌日twitterで謝っていたところを見ると2次会で何かあったのだろう。。。
楽しかったのは楽しかったので参加してよかったと思う。
開催してくれた@_3mameさんには感謝です。
自然言語処理基礎勉強会
久しぶりに自然言語処理基礎勉強会に出てみた。
この勉強会は教科書の
Foundations of Statistical Natural Language Processing
- 作者: Christopher Manning,Hinrich Schuetze
- 出版社/メーカー: The MIT Press
- 発売日: 1999/06/18
- メディア: ハードカバー
- 購入: 3人 クリック: 165回
- この商品を含むブログ (18件) を見る
を読む勉強会で略称はFSNLP。
基本的にM1が必須の勉強会でM2は出る必要がないけど、なんとなく参加してみる。
そして来週からも出る予定。
今日の範囲は5章コロケーションの前半部分。
頻度、平均・分散、仮説検定を使ったりしてコロケーションを探そうといったようなお話。
この勉強会は来年から教科書が変わるらしく、
- 作者: Dan Jurafsky,James H. Martin
- 出版社/メーカー: Pearson
- 発売日: 2008/04/29
- メディア: ペーパーバック
- クリック: 13回
- この商品を含むブログ (2件) を見る
を教科書として読んでいく予定らしい。
なので、来年M1として松本研に来る人はこの本を読むことになると思う。
自分も来年もしかすると読むことになるかもしれないので、早めに買って予習しておいた方がいいかな〜と考え中。
買っても当分は読んでる余裕はないけど、年明けくらいまでに欲しいな。
eNLPキックオフ
後期になって勉強会もやっとはじまった。
M1のゼミナール2の発表の日程が決まったので、ホワイトボードに書いて用意していると@mamorukさんに消されそうになって危なかった笑
なんかeNLPは人がどんどん増えてメインで10人以上いるという状況。。
ゼミナール2の発表を中心に日程を組むとM1でほとんど埋まってしまいM2は目次発表練習だけとかいうよううな状況に。。
進捗とかはいろいろあるし個別に相談するだろうからいいだろうけど、論文紹介できないのは少し寂しいかも。。
とりあえず内部wikiにでも関連文献リストを挙げていると誰かが紹介してくれそうなのでそのうち挙げようかと思う。
勉強会後に@mrcarrotくんと@ta_que_shiさんとハンターナという大和西大寺駅のほうにあるカレー屋さんに行く。
ハンターナセット(2,000円)を注文。このセットはお得で一品料理、サラダ、スープ、カレー3種(フィッシュ、チキン、ベジタブル)、ライス、ナン、デザート、紅茶がついている。
ちなみにカレー、ナン、ライスはおかわり自由。
フィッシュカレー。
チキンカレー(手前の赤いの)とベジタブルカレー。
ライスにナン。
デザート。ヨーグルトにヤシの木の蜜をかけたもの。
カレーはどれもおいしかったけど、個人的にライスに一番よくあったのはフィッシュカレー。
チキンカレーが3つの中では一番辛かった。
ヨーグルトにヤシの木の蜜の組み合わせはすごい合ってた。これは相性が抜群。
お得だけどサイフに優しくないので当分来ることはないだろう。。
研究会+歓迎会
前期以来の研究会ということで久しぶりだった。
Dの方3人の発表。
tetsuo-sさんの発表は共感できる部分も多々あった。
研究会後は10月から松本研に来たFrances Yungさんの歓迎会。
カレーを作るということで無理してでてきた*1。
今回のカレーはエビカレー。
鍋3つあったのだが、歓迎会が始まって一瞬でなくなってしまう。。
あとはお菓子を食べながら雑談。
歓迎会後、@keiskSくんに教えてもらったが
Bitext Alignment (Synthesis Lectures on Human Language Technologies)
- 作者: Jorg Tiedemann
- 出版社/メーカー: Morgan & Claypool Publishers
- 発売日: 2011/06/30
- メディア: ペーパーバック
- クリック: 1回
- この商品を含むブログを見る
- 作者: Claudia Leacock,Martin Chodorow,Michael Gamon,Joel Tetreault
- 出版社/メーカー: Morgan and Claypool Publishers
- 発売日: 2010/09/30
- メディア: ペーパーバック
- 購入: 2人 クリック: 11回
- この商品を含むブログ (3件) を見る
とかはPDFでも買えるらしい。
紙で買うほうがいいか少し悩む。
- 作者: 篠原一
- 出版社/メーカー: 作品社
- 発売日: 2003/03
- メディア: 単行本
- 購入: 1人 クリック: 8回
- この商品を含むブログ (9件) を見る
この本も買いたいので、買うとしてもとりあえずどちらか一方かな〜。
*1:前日の夜くらいから頭痛がひどく苦しんでいた
NLP若手の会2011
東京から帰って4日での発表は結構しんどい。
実験とかは帰ってきてソッコーやって、ポスターは前日からほぼ徹夜で作成という強行スケジュール。。
印刷もなんとか間に合ってよかったが、当日のブースターセッションの資料は間に合わなかったのでめちゃくちゃだった。。。
ポスターセッションではいろいろな人が聞きにきてくれてなかなか楽しめた。
東北大学の乾研でも言語教育系の研究をやっているらしく*1、いろいろと議論もできた。
負けていられないな〜とやる気になる。
自分の時間以外は疲れきって、休憩室で知り合いの方などと話すことが多かった。
B2で東京のほうから参加しにきた*2@iroha_dearさんとも少しだけお話する。
やる気があればいろいろとできると思うので頑張ってほしい。
いろいろありすぎて書くのが大変だけどまとめると
2日間でいろいろ収穫があり楽しかった
ということです笑
来年も発表できるといいな〜*3。
第5回言語学×自然言語処理合同勉強会で発表します
タイトル通り9月23日(金・祝)に京都大学で行われる第5回言語学×自然言語処理合同勉強会で発表をする*1。
場所は京都大学 吉田南キャンパス 1共32講義室で開始が13時からで3人の発表があり以下の通り。
- 川西 慧 (京都大学)
- 「ピアフィードバックは提供者自身にどのような影響を与えるのか?」
- 水本 智也 (奈良先端科学技術大学院大学)
- 「言語教育における自然言語処理の応用 ー 英語ストレス位置推定と誤り訂正 ー」
- 木本 幸憲 (京都大学 / 日本学術振興会特別研究員)
- 「日・英語における複文の構造的・機能的差異をめぐって」
自分の発表は学部時代にやってた研究の話を少しと今やっている学習者の文に対する誤り訂正の話をする予定。
言語処理関係者にとってあまり面白い話はできないかもしれませんが、残りのお二方の発表で楽しんでもらうということで許してください。
最後に今日のお昼ご飯。CLUB HOUSEというお店でハンバーグ。
スープがおかわりできるという珍しいお店。
シャーベットもつけてもらえた。
夕方、お菓子にザ・リッツ・カールトン カフェ&デリのティラミスを食べる。
形もおしゃれだが、味もいけてる。
*1:松本研の合宿と被っているので、合宿は遅れて参加