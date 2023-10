[シナモンAI]

製造業における大規模言語モデルを応用した、ナレッジ(業界・企業の特有知識)の活用に成功



国内の大手企業へAI(人工知能)ソリューションを提供する株式会社シナモン(本社:東京都港区、代表取締役Co-CEO:平野未来/堀田創 以下、シナモンAI)は、大規模言語モデル(LLM)を応用した製造業におけるトラブルサーチソリューションを開発する、当社の「IncidentAI」研究チームによる論文 『より安全な運用へ向けて:事故を未然に防ぐためのナレッジを活用した高圧ガス事故データの活用』 が、自然言語処理分野のトップ国際会議「EMNLP 2023」のIndustrial Track部門に採択されたことをお知らせします。



■EMNLP 2023: https://2023.emnlp.org/







EMNLP(Empirical Methods in Natural Language Processing)は、世界中のトップ企業や研究員、開発者が多数参加する、自然言語処理分野(NLP)の最難関国際会議で知られています。この度採択された 「Industry Track」 は、製造分野におけるNLPを応用した革新的なアプリケーションを発表するセッションで、特に今年度は急速に発展する大規模言語モデルの実用性のあるアプリケーションに関する論文の投稿が奨励されるなど、大きな注目を集めていました。



シナモンAIでは引き続き、ドメインナレッジ(業界・企業の持つ特有知識や知見)を有効活用していくための研究開発を強化するとともに、ビジネスシーンでの実用的なAIソリューションを提案してまいります。



研究概要:ドメインナレッジを活用したデータセットが事故防止に有益であることを証明





これまで、AI開発において一般的に入手しやすいコーパス(自然言語の大規模なデータベース)では、製造分野における安全予測へのAI活用は、専門的な知識を必要とする実務での利用に足る情報整理がなされていないため難しいとされていました。今回発表の論文では、シナモンAIの研究チームが企業や専門家とともに構築したデータセットが、高圧ガスプラントの事故報告の分析に有益であることが証明されています。本データセットは、実際の事故報告データ*を元にしており、専門家により構築されたデータセットが、事故を予防する安全予測分野において、実用的なシステムとして稼働することが分かりました。



当社研究チームは、固有表現認識(NER)、原因結果抽出(Cause & Effect)、情報検索(IR)の3つタスクを活用し、データセットの構築を行いました。これらのデータセットを活用することで、自然文(話し言葉のような文章)で記載された事故情報の構造化・分析・活用を一貫して実現することができます。今回の論文より、事故報告や事故予防の解析のみならず、様々な専門知識を必要とする用途において、NLP技術の適用範囲が大きく広がることが証明されました。





*高圧ガス保安協会が 2022 年に発行した高圧ガス事故に関する一般公開されている報告書から収集

※論文で発表したデータセットは( https://github.com/Cinnamon/incident-ai-dataset )に公開されています。



【論文原題】

Towards Safer Operations: An Expert-involved Dataset of High-Pressure Gas Incidents for Preventing Future Failures











■シナモンAI概要

社 名:株式会社シナモン

URL:http://www.cinnamon.ai

所在地:東京都港区虎ノ門3-19-13 スピリットビル6階

設 立:2016年10月

代表者:代表取締役Co-CEO平野未来 / 堀田創



[事業内容]AIプロダクト事業、AIコンサルティング事業

シナモンAIは、「誰もが新しい未来を描こうと思える、創造あふれる世界を、AIと共に」をパーパスに、高度なビジネスAIソリューション実現のため、AIコンサルティングとAIプロダクトを提供しております。お客様が保有するナレッジからAI時代の新たな事業構造を創造し、飛躍的な成長を先導する変革のシェルパ(先導役)として、多数の国内大手企業への提供実績を有しています。人工知能研究開発機能をベトナム(ハノイ・ホーチミン)および台湾に構え、高度なAI人材を獲得・育成するエコシステムを構築し、AI-OCR「Flax Scanner」、自然言語処理エンジン「Aurora Clipper」、音声認識エンジン「Rossa Voice」など、非構造化データを幅広くカバーする技術力を蓄積しています。直近では、独自のAI時代の戦略デザイン「ハーベストループ」とお客様のパーパスをつなげ、デジタルトランスフォーメーションやAI活用の推進を支援しています。



