第4回 言語学×自然言語処理合同勉強会(=第18回東大・東工大合同勉強会(T2 meeting))の詳細をお知らせいたします。言語学会@日本大学の直前の金曜日ということで特に言語学関係の方々には参加しやすくなったのでは、と期待しています。前回までと会場が異なりますのでご注意ください。
- 日時:6/17(金)17:00~20:00(日本言語学会(日本言語学会 - 日本言語学会第143回大会)の前日)
- 場所:国立情報学研究所(アクセス - 国立情報学研究所/National Institute of Informatics) 1208会議室
- 発表1:阿部二郎(北海道教育大学)
- タイトル:いわゆる「例外的格付与構文/主語から目的語への繰り上げ構文」の構造と意味
- 概要:「山田は田中がバカだと思っている。」は「と」を介して文の中に文を再帰的に埋め込んだ構造(補文構造)をなしている。これとよく似た「山田は田中をバカだと思っている。」という文があるが、その構造は一体どうなっているのだろうか。「田中をバカだ。」という文は存在しないから、単純な補文構造とは言えない。仮に、「バカだ(と)」の部分だけが補文なのだとしてもでは「田中を」はいったいどこから来ているのか。また、この種の文は、このような統語論的パズルを提示するだけでなく意味論的にも興味深い言語現象をもたらす。このタイプの文について、研究史を概観しつつ、その構造・意味の分析に新たな提案をする。
- 発表2:横野光(東京工業大学)
- タイトル:名詞が核となる表現の意味解析に必要な言語資源
- 概要:意味解析において名詞に求められる情報には,その名詞がどのようなカテゴリに属しているのかといったものや,取り得る属性とその属性値といったものがあり,例えば,前者については日本語語彙大系といった既存の言語資源が存在する.本発表では,特に名詞が核となるような表現の意味解析において,必要な情報について考察を行う.また,それらは既存の言語資源で対応できるか,新たな言語資源の構築を考えた時にどのような要件を満たすべきかなどについて議論する.
阿部氏の発表は、言語学会の公開シンポジウム「言語におけるデキゴトの世界とモノの世界」のStephen Wright Horn氏(Oxford大学)のtalk、「日本語のいわゆる〈主語から目的語への繰り上げ構文〉」についての良いイントロにもなると思います。
「太郎 に/から 本を借りた」みたいなやつ。
卒論でやったので先行研究のみ挙げておく。ちなみに、僕が卒論でこの現象にある程度以上言及している先行研究として挙げたもので再検討はしてないので、見落としとかその後出た研究とか、他にもあるのではないかと思う。あと、書式も特に揃えていない。
うち、柴谷1978、杉本1991、井島1997はこのニ句を「動作主」であるとしている。菅井2000は動作主説は取らず起点の「に」が可能になるのは着点側(ガ格)からの「働きかけ」が重要な要因であるとしている。現象の指摘・記述だけでなくある程度の分析もしているのはこの辺り。あと松本2000a, bは、「に」にはあまり焦点を当てていないが、関連する動詞の意味構造についてかなり参考になった記憶がある。詳しい事は各文献を参照。
ちなみに僕の卒論の主張は、菅井の論では説明できない現象があって、やっぱり動作主説の方が筋が良いのではないか、というものだった。
僕は全く働いてない(上に参加もしていない)のですが、id:langstatさん、id:kana0355さんの尽力により、第二回言語学×自然言語処理勉強会が開催され、だいぶ盛況だったとのことです。プログラムおよび会の様子はlangstatさんの以下の記事より読むことができます。
運営に関わった皆様、発表者の皆様、また当日参加された皆様、おつかれさまでした。
第三回は年明けに関東で開催する予定を立てています。またここやいくつかの方法で告知しますので、よろしくお願いします<(_ _)>
第一回の言語学×自然言語処理勉強会、無事終了しました。
自然言語処理、言語学の両発表がわかりやすかったこと、議論に割ける時間が多かったこと、変に固い雰囲気にならずに進行したことなどが重なって、当初の目論見通り(個人的には予想以上に)、結構突っ込んだ交流ができたのではないかと思います。ちょっと残念だったのは言語学研究者の参加者が少なかったことですが、まあ会場も満員状態でしたし、今後の努力目標にしたいと思います。懇親会も含めて色々あった議論は、楽しかったし、また刺激的でした。おそらくその中には学会などでは実現しにくいものもあるのではないかと思うので、こういう規模の企画も面白いし、重要なのではないかと。
お話をくださった@hikaruyさん、遠くから参加していただいたd:id:langstatさん、こういう難しい場でわかりやすい発表をしてくださった発表者のお二人、色々気軽な質問や議論を投げかけてくださったT2 meetingのみなさん、会場がわかりにくかったにも関わらず頑張って来てくださった@WaveCoilerさん、ありがとうございました。
さて、今後のお話ですが、@hikaruyさんとも継続的にできれば、という話が出ましたし、今回参加したいけど色々あって参加できなかったというような方も結構いらしたようですし、何より単発的ななんかちょっと面白かった試み、で終わってしまってはもったいないと思いますので、次を考えています。
すでにlangstatさんからd:id:kana0355さんにお誘いがあって、承諾された?ようなので↓
次はぜひ関西で!みなさま(また)よろしくお願いします。
勉強会の内容が決定いたしました。以下、いただいた案内を掲載します。
今回のT2 meetingは「NLPと言語学」というテーマで,通常のNLPの研究者による発表だけでなく,言語学の研究者による発表を予定しています.また,言語を扱うという近い関係にあるこれら2つの分野において互いにどのような貢献が可能なのか,といったようなことから,そもそもNLP,言語学って何?ということまで幅広い議論を行うセッションを計画しています.NLPの若手研究者だけでなく,言語学の若手研究者,また,これらの分野に興味がある方の参加を歓迎します.
- 日時:2010/8/19(木) 16:00 - 20:00
- 場所:東京工業大学 大岡山キャンパス 西8号館W 6F コラボ室
- 発表1
- 発表者:荒牧 英治(東京大学 知の構造化センター)
- 題目:「偏りなく誤る言語処理: 適合度による言語処理技術の検定」
- 概要:医療分野における言語処理研究を紹介する.自然言語処理をはじめ,多くの情報処理の解析は完全でなく,誤りをおかす可能性がある.このため,技術的にはほぼ上限と考えられる精度に達しても実用化が不可能であったり,また,実用化されたとしても最終的には人手によるチェックを必要とする場合が多い.特に,いくつかの処理を組み合わせた複雑なシステムでは,高い精度を維持することは極めて難しい.そこで,本研究では,発想をかえ,個々の入力の精度をあげるのではなく,処理結果の全体の分布の正確さを目指す.本発表では,分布の正確さ(真の分布と推定された分布)の一致度を適合度(goodness of fit)を用いて評価し,これを最大化する機械学習を提案する.
- 発表2
@hikaruyさんと、言語学研究者と自然言語処理研究者間の交流研究会/勉強会を計画しています。
日付、場所など具体的なことはまだ決まっていませんが、決定したらまた告知していきます。あと、内容としては今のところ以下のような提案が挙がっています。
さてそこで、この記事では、会の内容/方向性を決めていく一つの手段として、以下のような項目に対する事前アンケートを取ってみたいと思います(回答したい方の番号とともに、コメント欄にお願いします)。
もちろん、当日の参加が未定の方でも構いません。ただ、以下の点にご注意ください。
よろしくお願いいたします。
会の、その他のことに関する質問・意見を吸い上げることのできるエントリも作った方が良いのかもしれませんが、それはまた改めて。
テーマを「言語学×自然言語処理」としたり、母体となる勉強会があったりしますが、参加者を何等かの方法で制限するということは特に考えていません。
また、上のアンケートに関することでも、それ以外のことでも、twitterで僕に向かってつぶやいていただいても大丈夫です。idは@dlitです。
日時・開催場所が以下のようにほぼ決定いたしました。
内容については、今回は詳しいチュートリアルは見送りにして、両サイドからの研究発表2本とディスカッション、という形に落ち着きそうです。
hikaruyチュートリアル的なことで言語学な人に聞きたいことなんですが,
・言語学の下位分野について.どのようなジャンルが存在するのか
・研究のスタイルとか方法論
とかがあります.
個人的には
・現在の言語学の研究全体について感じていること
が,もしあればお聞きしてみたいなとは思います.
日本語学会@日本女子大学に合わせて、以下の研究会を開催いたします。
気軽にご参加ください。
質問などはコメント欄にどうぞ。
(1) とき: 5月29日(土),10:00-12:00
(2) ところ: 文京区勤労福祉会館1階第一・第二創作室(JR/東京メトロ駒込駅,JR田端駅より徒歩10分。日本女子大学目白キャンパスまで4km。電車と徒歩で40分弱。徒歩のみでは50分弱)
【Web page】:http://www.city.bunkyo.lg.jp/sosiki_busyo_keizai_shisetsu_kinpuku.html
【google map】:http://maps.google.co.jp/maps?hl=ja&q=%E5%8B%A4%E5%8A%B4%E7%A6%8F%E7%A5%89%E4%BC%9A%E9%A4%A8%E3%80%80%E6%96%87%E4%BA%AC%E5%8C%BA&lr=lang_ja&rlz=1I7TRDJ_ja&um=1&ie=UTF-8&sa=N&tab=wl
日本語学会が開催される日本女子大学から少し離れますし,道のわからない方もいらっしゃると思いますので,09:40にJR駒込駅南口に集合いただければ,引率いたします。
(3) 発表
a. 今田 水穂(筑波大学大学院人文社会科学研究科文芸・言語専攻準研究員)
「名詞句の意味論の動詞意味論への応用:動詞における存在論と解釈の理論」
b. 田川 拓海(筑波大学人文社会科学研究科IFERI研究員)
(4) 備考
当日は参加費として300円ほど頂くことを予定しています。なにとぞご了承ください。
※昨日消えてしまったのはこの話題ではありません。
伝聞だが、関西の方(に限られるかどうかもわからない)で「すぐに」とほとんど同じ感じで「たちまち」を使うこと(地域)があるらしい。
たちまち準備できないんですよ。
(≒すぐには準備できないんですよ。)
これがある程度一般的に言える言い方なのかどうかもまだ調べていないが、僕がこの例を聞いて思ったのは、面白いな、ということと、共通語の「たちまち」ってもしかしてPPI(Positive Polarity Item: 肯定極性項目)なんじゃね?ということだった。
- たちまち恋に落ちた。
- *たちまち恋に落ちなかった。
- すぐには恋に落ちなかった。
2は「「たちまち恋に落ちる」ことはなかった」というように解釈できない、というか文自体許容できない気がする。
全然吟味してないから間違ってるかも。ただの思いつき。
killhiguchi 陳述副詞や程度・量の副詞は、PPIやNPIであるだけでなく、必然的に陳述と呼応することが多いので、探せばいくらでもあるように思います。無論副助詞類も。
体力がないので、ここまで。
dlit>killhiguchiさん
いつもありがとうございます。
副詞の統語的位置というのは難しい問題の一つだと思いますが、陳述副詞はその性質上、PPIやNPIになることがあるのは自然に思います。程度・量の副詞に関しては僕は良いアイディアを持っていません><
そんな中、「たちまち」というのは意味的に考えるとまあ様態副詞かなと思ったので、通常は統語的に低い位置にあると考えられる様態副詞の中にPPIっぽいものがある(=否定辞の統語的スコープ外にある?)というのはちょっと面白いな、と思ったのでした。
私もあまり余裕が無いので取り急ぎ言い訳だけ(^^;
killhiguchi 頭痛で気絶していたのですが目が覚めました。
反統語論者としては統語的位置などどうでもいいのですがww、タチマチは程度修飾だと思いますよ。
副詞らしい副詞については川端「時の副詞」を。その特徴については小柳「副詞と否定」と、『日本語の構造変化と文法化』所収を。基本的概念は森重「群数および程度量としての副助詞」を。副詞と陳述の関係についてはきっと工藤浩がネットに公開しているだろうwwと思ってみたらありました。http://www.tufs.ac.jp/ts/personal/kudohiro/degree.html「多くの程度副詞は純然たる否定形式とは共起しないと言えそうである」「情態副詞や形容詞副詞形が否定の作用域の内部に収まるのと性格を異にする」相変わらず結論はないようですww。
年度末でお忙しいことと思います。来年度からも大変でしょうが頑張ってください。
killhiguchi>タチマチは程度修飾だと思いますよ。
説明が足りませんでした。一般に、タチマチは様態修飾といわれます。動詞を修飾するからです。
しかし、川端善明的には様態修飾ではありません。「時の副詞」です。これがどのように程度修飾かと言うと…疲れました。川端をお読みください。><
はい、そうです。
ここに挙げたのは「教わる」などに関するもので、その中でもニに着目しているものですね。
ただ、卒論では受動文の動作主のニに関してはあまり詳しく論じられなかったのを覚えています。