AAAI-20に参加

AAAI-20に聴講参加しました。AAAI-20とは、 Association for the Advancement of Artificial Intelligence の略で、米国で開催されているAI学会の一つです。今回第34回ということで歴史の長い学会です。20は2020年の意味です。

公式ウェブサイト

今回はニューヨーク・ミッドタウンにあるヒルトンホテルで開催されました。

写真の説明はありません。

今回の聴講目的は、はこだて未来大学での研究において研究成果の検証表現のヒントを得るためです。ですので、NLP関連のオーラル発表とポスター発表を中心に聴講しました。

アメリカ開催の学会にしては白人がとても少ないと感じました。1割くらいじゃないかと思います。また、NLP関連のセッションのほとんどが中国からの研究者で、コロナウィルス騒ぎでUSへの渡航許可(VISA)が下りないため発表者が来れず、動画再生という形式になりました。このため、研究者に会えず、情報交換ができないという状況でした。私が聴講したセッションで実際にそこに来て喋っている人は2割程度だったと思います。(36セッション聞きましたが、7~8人しかしゃべってない、ということ)

NLP関連のセッションはいくつかの種類があり(エンティティ抽出、機械翻訳、対話、リレーション、セマンティックなど)、対話セッションが多かったので私にとってはラッキーでした。対話セッションにはチャットボット、ロボットの対話システムの話と、人と人が話している文章を処理する客観的な分析の話が混じっていました。

採用論文の一覧はこちら

セッションの時間割はこちら

採用論文はこちらに掲載されます。今回の分はまだ掲載されていません。

一つのセッションは3部のオーラル発表と、ポスターセッションのライトニングトーク(Spotlightingと呼んでました)を2分ずつやってました。

聴講したものからいくつか気になったものをご紹介。

1834: Leveraging Multi-token Entities in Document-level Named Entity Recognition

Multi-token Entity(ME)はまさに複合語のことで、私の注目している課題と一致します。この論文が提案している手法はME Informed Document(MEID)というもので、Named Entity Recognition(NER):固有表現抽出において100%処理できた、という主張でした。まぁ、辞書ベースでやる点も似ているので「そりゃ100%いくでしょ」ということもありますが、参考にはなります。

10052: Towards Scalable Multi-Domain Conversational Agents:The Schema-Guided Dialogue Dataset

こちらはGoogleの研究で、対話の予測器に Deep Neural Network(DNN) を使うが、話題(対話ドメイン)ごとにDNNを作るので面倒だし無駄が多い、そこで統一できないか、という取り組みの事例。スキーマガイドというのを使うことで共通DNNを実現できた、という内容。すでに34API、16ドメインに対応しているそうで、Google APIとして公開されているそう。検証方法としてDSTC8というデータセットを使って実施しています。

Poster 9649: End-to-End Trainable Non-Collaborative Dialog System

将来、対話型のシステムが「悪いやつから話かけられて、システムから情報を不正に入手する」ことを防ぐAntiSpamとか「システムが子供に話かけてなにかを買わせてしまう」ことを防ぐ PersuasionForGood というような取り組みで、会話内容をフィルターするための検出方法の提案でした。

Poster 1741: Corpus wide argument mining – a working solution

IBM Project Debatorの大量書き込みからSentiment-levelのデータマイニング(テキストマイニング)をする技術の説明。ICAやってた私としては懐かしい感じ。単語やEntityベースのマイニングより意見の傾向を正しく分析できる、という説明でした。IBM Research Haifa研究所の人たちでした。

今回の聴講で学んだことは以下のようなことです。

  • NLP論文はNE解析、Link解析、分類にだいたい分けられそう。
  • NER論文には流行があって、DNN、とくにBI-LSTMを使うものが圧倒的に多い。
  • 英語データセットで精度勝負のものが多い。MultiWOZ, CoNLL, OntoNotes, DSTCといったものがよく使われている。
  • Muman Evaluationという手法を使っている人が多い。アノテーション等から精度を図るのでなく、人間がチェックして精度を図る手法。私の研究には使えるかも。

以上、学会聴講報告でした。