自然言語・人工知能開発の補助

情報・知能工学課程
実務訓練機関:ShannonLab株式会社

自然言語処理

図4
日本語形態素解析システムMecabを用いて、文章の解析を行った。パターン認識モデルSVMを用いて、文章の2値分類を行った。形態素解析によって、分かち書きされた文字を動詞前後の文字を纏めるプログラムを作製した。様々な語尾を指定した語尾に変換するプログラムを作製した。Wikipediaのダンプデータを用いて、オントロジー解析を行った。また、単語のTFIDFを求めた。

TweetBotの作製

図5Twitterから会話データを取得するプログラムを作製した。ランダムなユーザーのタイムラインを取得し、ツイート内容をSVMにかけユーザーが人工知能に興味があるかどうかを分類した。特定のユーザーを自動フォローし、一定期間内にフォローが返ってこなかったらリムーブをするプログラムを作製した。TFIDF、オントロジー解析を用いてツイート(タイムライン)からユーザーの好みを推定するプログラムを作製した。

セミナーの開催

図7図6図9図8プログラミング言語pythonの勉強会を開催。プログラム・資料を一から作成し、準備に取り掛かった。Python・プログラミング言語を初めて触るような社会人の方々に指導した。プログラムの書き方を具体的に・分かりやすく教えるため、線形代数の計算を例にした。また、文章をSVMによるポジネガ分類の勉強会も開催した。この勉強会では指導の補佐を務め、プログラムのエラー等の質問に答えた。

まとめ

この実務訓練で初めて自然言語処理を取り扱った。使用した言語はPythonで、これも初めて触ったものなのでCやJavaと違った記述に戸惑うこともあったが、なんとか開発業務を進めることができた。日本語は英語に比べ文章の区切りや、文字列の意味が曖昧だったり、ツイッターのようなラフな文章だと解析が困難で大変だった。また、初めて勉強会というものに参加し、講師として指導を行なった。友達や後輩に教えるのとは違って、年上の方に物事を教えるのは緊張したが、受講者には満足して頂いたようなので安心した。

Comments are closed.