自然言語・人工知能の開発の補助

情報・知能工学課程
実務訓練機関:ShannonLab株式会社

ディープラーニングでの自然言語

図11.ニューラルネットでの文章のポジネガ判定

ニューラルネットワークを用いて,日本語文章をポジティブ,ネガティブに分類する.日本語をMecabを用いて形態素解析し,それぞれをWord2Vecを用いてベクトル化する.それらのベクトルの重心を文章ベクトルとした. Word2Vecを用いることで単語の特徴を表したベクトル化が可能となる.文章ベクトルを学習データ,ポジネガを正解データとして入力し,学習を行う.

2.RNNでの文章予測

図2データを時系列的に学習・予測できるRNNを用いて,途切れた日本語文章を入力したときに次に来る単語の予測を行うシステムを構築した.RNNにはLSTMを用いた.LSTMは従来のRNNと違い,長期依存を学習可能である.これにより,長い文章も学習が可能となる.日本語文章をMecabを用いて形態素解析し,それぞれの単語をWord2Vecを用いてベクトル化する.それらのベクトルを順番に学習させていく.その時に次の単語ベクトルを正解データとして与えることで,単語ベクトルを時系列的に学習でき,予測が可能となる.

LINE-Botの開発補助

スクリーンショット-2017-04-16-20.41.41-1

API連携部分の開発

ユーザがLINE-Botにメッセージを送信した際に,メッセージをLINE APIで受け取る.そのメッセージ企業APIを用いて返信文生成に送信する.その返信文をLINEを通してユーザに返すAPI連携部分を開発した.LINE APIを利用するためにはWeb上で動作させる必要があったので,サーバ上で動作するように開発した.
 

Djangoを用いたWEBサービス開発補助

CSVファイルをWeb上で管理

DjangoはPythonで実装されたWebアプリケーションフレームワークである. DjangoにはWebアプリの管理画面があり,そこでアプリが使用するデータベースを管理できる.このデータベースを用いて,CSVのアップロード,ダウンロード,削除,ユーザごとの権限管理,CSVのデータを他のデータベースに反映する等のファイル操作を開発した.
図3

勉強会の講師

企業が主催する勉強会での講師

同僚のインターン生とともに企業が主催する小規模セミナーで講師を務めた.セミナーは2回行い,それぞれ担当講師,補佐を交代で務めた.「pythonでの線形代数」,「文章のポジネガ分類を通した機械学習」と題して,スライド資料の作成,デモプログラムの作成・動作確認等の準備をした.当日は5,6人の参加者がいたが,無事勤めを果たせた.
スクリーンショット 2017-04-16 20.44.59

まとめ

・日本語を用いた自然言語処理の実装・テストを通して,奥深さや難しさを感じた.
・様々なディープラーニングの手法を学び,実装に触れることが出来た.
・勉強会での講師は,誰かに説明することの大切さや難しさを肌で感じることが出来た.
・Web上での開発は経験がなかったので,Webアプリ,サーバ等の知識を得ることが出来た.
・報告資料の作成等で,正確にわかりやすく情報を伝える方法が身に付いた.
・実際の企業業務を体験することで,職場の上司や同僚との関係を学ぶことができた.

Comments are closed.