酒井浩之

サカイヒロユキ (Hiroyuki Sakai)

基本情報

所属: 成蹊大学理工学部理工学科教授

学位: 博士（工学）(豊橋技術科学大学)

J-GLOBAL ID: 200901074063121489
researchmap会員ID: 5000031733

外部リンク: https://hawk.st.seikei.ac.jp/sakai/

研究キーワード

研究分野

情報通信 / 知能情報学 / 自然言語処理

経歴

学歴

2002年4月 - 2005年3月

豊橋技術科学大学工学研究科電子・情報工学専攻
2000年4月 - 2002年3月

豊橋技術科学大学工学研究科知識情報工学専攻
- 2002年

豊橋技術科学大学
1998年4月 - 2000年3月

豊橋技術科学大学工学部知識情報工学科
- 2000年

豊橋技術科学大学

論文

Automatic Generation of Patent Maps by Estimating Technical Problems and Solutions Using T5

Yuki Kobori, Hiroyuki Sakai, Kengo Enami

2024 16th IIAI International Congress on Advanced Applied Informatics (IIAI-AAI) 21 237-242 2024年7月6日査読有り
解釈性を考慮した統合報告書の自動評価

河村康平, 酒井浩之, 永並健吾, 高野海斗, 中川慧

人工知能学会論文誌 39(4) FIN23-E_1 2024年7月1日査読有り
Discovery of Rare Causal Knowledge from Financial Statement Summaries.

Hiroki Sakaji, Jason Bennett, Risa Murono, Kiyoshi Izumi, Hiroyuki Sakai 0003

CoRR abs/2408.01748 2024年
株価と決算短信を用いた株式動向を表現する文の自動生成

根岸龍, 酒井浩之, 永並健吾 35(3) 693-699 2023年8月15日査読有り
債券市場における金融極性辞書の自動構築

今井康太, 酒井浩之, 永並健吾, 稲垣真太郎

日本知能情報ファジィ学会誌 34(4) 673-682 2022年11月15日査読有り

もっとみる

MISC

金融・経済ドメインを対象とした言語処理

坂地泰紀, 和泉潔, 酒井浩之

自然言語処理 = Journal of natural language processing 27(4) 951-955 2020年12月
学習データ自動生成による市況分析コメント作成のための要因文と補完情報の抽出

酒井浩之, 坂地泰紀, 和泉潔, 松井藤五郎, 入江圭太郎

人工知能学会全国大会(Web) 34th 2020年
金融情報学:ファイナンスにおける人工知能応用

関和広, 水田孝信, 八木勲, 落合友四郎, 酒井浩之, 和泉潔

人工知能 32(6) 905‐910 2017年11月1日
決算短信から抽出した原因・結果表現の意外性の判定 (言語理解とコミュニケーション) -- (第11回テキストアナリティクス・シンポジウム)

室野莉沙, 酒井浩之, 坂地泰紀, ベネットジェイスン

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 117(207) 93-98 2017年9月7日
決算短信からの業績要因文の抽出 (言語理解とコミュニケーション) -- (第11回テキストアナリティクス・シンポジウム)

酒井浩之, 松下和暉

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 117(207) 87-91 2017年9月7日
都道府県議会会議録からの意見や意志を表す発言の抽出

坂地泰紀, 酒井浩之, 小林暁雄, 内田ゆず, 乙武北斗, 高丸圭一, 木村泰知

言語処理学会第23回年次大会(NLP2017) 426-429 2017年3月
大学Webページからの研究室Webページの抽出

宮崎敦也, 酒井浩之, 坂地泰紀

成蹊大学理工学研究報告 53(2) 25-28 2016年12月

In this paper, we propose a method that extracts laboratory front pages from university web sites. Our method extracts the laboratory front pages by using SVM and applying some rules. Moreover, we developed the laboratory search system which is able to retrieve laboratory front pages extracted by our method. We evaluated our method and it attained 85.0% precision and 65.5% recall, respectively
関連企業集合からの共通要素と新規関連企業の抽出

田中瑞竜, 酒井浩之, 坂地泰紀

電子情報通信学会技術研究報告 116(213(NLC2016 13-28)) 19‐24 2016年9月1日
ニコニコ動画に頻出する特徴コメントの抽出

吉岡晋作, 坂地泰紀, 酒井浩之

電子情報通信学会技術研究報告 115(445(NLC2015 44-53)) 1‐5 2016年1月28日
製品名と特許における名称の言い換え知識の抽出

坂地泰紀, 所佳祐, 酒井浩之

人工知能学会全国大会論文集(CD-ROM) 30th ROMBUNNO.1H2‐4 2016年
ニコニコ動画に投稿された動画の新しいタグの獲得

坂地泰紀, 小花聖輝, 小林暁雄, 酒井浩之

ファジィシステムシンポジウム講演論文集(CD-ROM) 32nd ROMBUNNO.WD3‐3 2016年
OS-13 金融情報学 : ファイナンスにおける人工知能応用(オーガナイズドセッション,<特集>2015年度人工知能学会全国大会(第29回))

酒井浩之, 和泉潔, 八木勲, 西山昇, 中山慎一郎, 山本竜市, 成蹊大学, 東京大学, 神奈川工科大学, Dragons' Desk Limited:千葉商科大学, / 早稲田大学

人工知能 = journal of the Japanese Society for Artificial Intelligence 30(6) 784-784 2015年11月1日
大学Webページからの研究室トップページの抽出

宮崎敦也, 酒井浩之, 坂地泰紀

電子情報通信学会技術研究報告 115(222(NLC2015 17-33)) 37-41 2015年9月3日
ニコニコ動画からのポジティブ・ネガティブコメントの抽出

坂地泰紀, 酒井浩之

電子情報通信学会技術研究報告 115(222(NLC2015 17-33)) 31-35 2015年9月3日
新聞記事からの因果関係の抽出

坂地泰紀, 酒井浩之, 増山繁

成蹊大学理工学研究報告 51(2) 23-27 2014年12月

This paper proposes a method that extracts causal knowledge from news paper articles via clue expressions. Our method decides whether a sentence includes causal knowledge or not when the method extracts it. Therefore, our method can extract causal knowledge accurately. Furthermore, the advantage of our decision method is to extract causal knowledge manually without dictionaries and patterns.
株価に影響を与える重要な出来事が記載された記事の自動抽出

中山大, 坂地泰紀, 勝田研一郎, 酒井浩之

成蹊大学理工学研究報告 51(2) 53-60 2014年12月

This paper proposes a method of extracting important articles that influence the stock price of companies from financial articles. In the first step, our method obtains dates that have large difference from previous day at stock price of a selected company. In the second step, our method acquires articles that are published around the obtained dates and concern the selected company from financial articles. In the third step, our method extracts articles that influence the stock price of the selected company by using SVM as a machine learning method from the acquired articles. Finally, we evaluated our method. As a result, our method achieved 69.8% precision and 53.1% recall.
ニコニコ動画からのポジティブなコメントを抽出 (言語理解とコミュニケーション) -- (第5回テキストマイニング・シンポジウム)

石淵準也, 坂地泰紀, 酒井浩之

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114(211) 17-21 2014年9月11日

本研究では,ニコニコ動画サイトに投稿された動画のコメントから,例えば「もっと評価されるべき」などのようなポジティブなコメントを自動的に抽出することを行った.ポジティブなコメントを自動的に抽出できることにより,例えば政見放送へのコメントの中からポジティブなコメントを得ることができ,政見放送の反応が即時に分析できるようになる.
企業Webページを対象とした企業検索システムのための検索クエリに関連するタグの推定 (言語理解とコミュニケーション) -- (第5回テキストマイニング・シンポジウム)

酒井浩之, 坂地泰紀

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114(211) 41-45 2014年9月11日

本論文では,企業Webページを対象とした企業検索システムにおいて,検索クエリに関連したタグを自動的に推定し,検索された企業ごとに推定されたタグを付与する手法を提案する.例えば検索クエリが「テキストマイニング」であれば,「開発」「提供」「導入」などのタグを推定する.そして,推定したタグを検索された企業に付与することで,例えば「テキストマイニング」技術を「開発」している企業を検索することができるようになる.
ニコニコ動画と日経プレスリリース記事との関連付け (言語理解とコミュニケーション) -- (第5回テキストマイニング・シンポジウム)

柴原啓太, 坂地泰紀, 酒井浩之

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114(211) 75-79 2014年9月11日

近年,インターネットの発達により,動画共有サービスや動画配信サービスなどの動画サイトが普及している.本研究では,動画サイトの一つであるニコニコ動画を対象に,動画に付与されているタグ情報を用いて,動画に最適な日経プレスリリース記事を関連付けることで,効果的かつ効率的なインターネット広告の配信を目的とする.
Twitterからのキャラクター印象表現の抽出(抽出,第4回テキストマイニング・シンポジウム)

田原如菜, 坂地泰紀, 酒井浩之

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 113(429) 5-10 2014年1月30日

本研究では,キャラクターに対応する印象表現をTwitterから抽出する手法を提案する.具体的には,キャラクターとして,ゆるキャラを対象とし,キャラクター名に対応する印象表現(「可愛い」や「癒される」等)を抽出する.人手で印象表現辞書(喜,怒,哀,怖,恥,好,嫌,昂,驚,安,楽,その他のカテゴリーから成る363表現)を作成し,キャラクター名と印象表現辞書に存在する印象表現が含まれているツイートを取得する.そして,キャラクターごとに印象表現を抽出し,実際にアンケートで印象調査した結果と,本手法で抽出した印象表現を比べて評価した.
決算短信PDFからの因果関係抽出に基づく過去事象間の関連表示システム

坂地泰紀, 酒井浩之, 増山繁

人工知能学会全国大会論文集 28 1-4 2014年
企業の決算短信PDFからの業績要因の自動抽出 (言語理解とコミュニケーション)

西沢裕子, 酒井浩之

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113(213) 67-72 2013年9月12日

本研究では,企業のWebページで公開されている,決算短信のPDFファイルから業績要因を含む文を自動的に抽出する手法を提案する.業績要因を含む文とは,例えば「スマートフォンは引き続き拡大しました.」のような文とする.具体的には,経済新聞記事の業績発表記事から,業績要因を得るために自動的に抽出した手がかり表現(例えば,「が好調」など)と,抽出対象の企業のWebページから抽出したキーワードを用いることで,業績要因を自動抽出した.
経済新聞記事より株価変動に影響を与える重要な記事の自動抽出 (言語理解とコミュニケーション)

中山大, 酒井浩之

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113(213) 61-66 2013年9月12日

現在、個人投資家が増加している.しかし,すべての個人投資家が投資に対して知識や経験を持ち合わせているとは言い難い.そこで,本研究では,日本経済新聞記事より過去にある企業の(株)価に変動を与える重要な記事を自動で抽出する方法を提案した.具体的には,(株)価のデータより前日比を計算し,前日比が大きかった日付を取得する.取得した日付をもとに,その周辺の日付でその企業に関連した新聞記事を抽出する.そこから訓練データを作成し,訓練データに含まれる単語を素性とし,SVMにより生成した分類器で記事を分類する.評価実験では,F値が44となった.F値を上げるために,改良手法として,企業WEBページに含まれる単語を素性に加え,さらに,全実行結果より誤りとなった結果をもとに特徴を見つけ除去することも行った.再度評価したところ,F値は57,精度は73%となり,良好な結果が得られた.
企業WEBページからの企業の事業に関連するキーワードの自動抽出 (言語理解とコミュニケーション)

勝田研一郎, 酒井浩之

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113(213) 13-16 2013年9月12日

本研究では,就職活動支援システムの一環として利用することを目指すために,企業WEBページから関連するキーワードを抽出する手法を提案する.ここで,抽出すべきキーワードとして,企業の行っている事業や関連する商品などとする.本手法では,企業のWEBページを収集し,その中に含まれている単語の中から,文書頻度などを使用して,事業と関連のあるキーワードのみを抽出する.
言語オントロジーによる言語テスト自動生成を用いたアルツハイマー型認知症早期発見支援システムの開発と検証 (人工知能学会全国大会(第26回)文化,科学技術と未来) -- (オーガナイズドセッション「OS-05 知的インタラクティブシステムのためのインタラクションデザイン」)

石渡亮平, 酒井浩之, 鶴田雅信

人工知能学会全国大会論文集 26 1-3 2012年
新聞記事中の文が因果関係を含むか否かの判定 (自然言語処理(NL) Vol.2010-NL-197)

坂地泰紀, 増山繁, 酒井浩之

情報処理学会研究報告 2010(2) 4p 2010年8月
新聞記事中の文が因果関係を含むか否かの判定

坂地泰紀, 増山繁, 酒井浩之

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 110(142) 47-50 2010年7月15日

本論文では,新聞記事中の文が因果関係を含むか否かの判定を行う手法を提案する.手がかり表現を伴う因果関係に限定し,有無の判定を行う.因果関係を示す手がかり表現は,因果関係以外の意味を持っている場合がある.例えば,手がかり表現「から」は因果関係以外に,出発する位置を表す意味があり,「京都から大阪」などには因果関係は含まれない.このような因果関係を示す手がかり表現が含まれていても,因果関係以外の意味であるものを除くために,本手法を提案する.意味的な素性として拡張言語オントロジーを用いることと,学習データを自動的に増やすことにより,本手法の性能が向上した.
製品・部門情報の企業業績要因表現からの抽出

西崎海人, 酒井浩之, 増山繁

人工知能学会全国大会論文集 24 1-4 2010年
特許文書からのブートストラップ手法を用いた課題・効果表現対の抽出 (言語理解とコミュニケーション)

坂地泰紀, 野中尋史, 酒井浩之

電子情報通信学会技術研究報告 109(142) 85-92 2009年7月22日
特許文書からのブートストラップ手法を用いた課題・効果表現対の抽出

坂地泰紀, 野中尋史, 酒井浩之, 増山繁

情報処理学会研究報告. 自然言語処理研究会報告 2009(14) 1-8 2009年7月15日

特許文書から直接的なユーザの便益に相当する表現と,技術上の解決課題を示す表現を自動的に抽出するアルゴリズム「Cross-Bootstrapping」を提案する.抽出した直接的なユーザの便益に相当する表現と,技術上の解決課題を示す表現はパテントマップを生成するために役立つ.本手法は,二つの手がかりと統計情報を用いて,ブートストラップ的に表現対を抽出する.また,辞書や人手により作成したパターンを用いず,自動的に表現を抽出することができる.最後に本手法の評価実験を行い,パテントマップを自動生成するために,十分な性能を達成したことを確認した.
特許明細書からの出願目的・技術課題情報の抽出

酒井浩之, 野中尋史, 増山繁

論文集 23 1-4 2009年
企業業績要因文の経常的か否かに基づく分類とイベントスタディ法に基づく分析

藤村真太郎, 酒井浩之, 増山繁

論文集 23 1-4 2009年
2-A-4 企業の業績発表記事から抽出した業績要因への極性付与(金融工学(3))

酒井浩之, 増山繁

日本オペレーションズ・リサーチ学会春季研究発表会アブストラクト集 2008 116-117 2008年3月25日
企業の業績発表記事からの業績要因抽出と極性付与

酒井浩之, 増山繁

人工知能学会全国大会論文集 22 1-4 2008年
2-D-4 景気動向を示す根拠表現の抽出と分類(統計)

坂地泰紀, 酒井浩之, 増山繁

日本オペレーションズ・リサーチ学会秋季研究発表会アブストラクト集 2007 194-195 2007年9月27日
景気動向を示す根拠表現の抽出と分析

坂地泰紀, 酒井浩之, 増山繁

情報処理学会研究報告. 自然言語処理研究会報告 2007(76) 151-156 2007年7月24日

本研究では,新聞記事から景気動向を示す「根拠となる表現」を統計的手法を用いて自動的に抽出する手法を提案する.また,抽出された景気動向を示す「根拠となる表現」を景気が回復することを示すPositive表現と悪化することを示すNegative表現に分類する手法も併せて提案する.企業や投資家にとって,株価や商品の売行きを予測するために,景気動向を知ることは重要なことである.そこで,我々は景気動向に関する記事から景気動向を示す「根拠となる表現」を抽出し,それを用いることにより,景気動向の予測が可能ではないかと考えた.今回,景気動向を予測するための材料として,景気動向の根拠となる表現を抽出し,それが景気が回復することを示すのか,悪化することを示すのかを判定する.我々は1990年から2005年の日経新聞を用いて実験し,景気動向を示す「根拠となる表現」の抽出手法と分類手法をそれぞれ評価した.その結果,景気動向を示す「根拠となる表現」の抽出手法に関しては適合率が71.43%,再現率が33.33%となり,分類手法に関してはPositive表現分類のF値が0.695, Negative表現分類のF値が0.849となった.
景気動向を示す根拠表現の抽出と分析(用語・情報抽出)

坂地泰紀, 酒井浩之, 増山繁

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 107(158) 151-156 2007年7月17日

本研究では,新聞記事から景気動向を示す「根拠となる表現」を統計的手法を用いて自動的に抽出する手法を提案する.また,抽出された景気動向を示す「根拠となる表現」を景気が回復することを示すPositive表現と悪化することを示すNegative表現に分類する手法も併せて提案する.企業や投資家にとって,株価や商品の売行きを予測するために,景気動向を知ることは重要なことである.そこで,我々は景気動向に関する記事から景気動向を示す「根拠となる表現」を抽出し,それを用いることにより,景気動向の予測が可能ではないかと考えた.今回,景気動向を予測するための材料として,景気動向の根拠となる表現を抽出し,それが景気が回復することを示すのか,悪化することを示すのかを判定する.我々は1990年から2005年の日経新聞を用いて実験し,景気動向を示す「根拠となる表現」の抽出手法と分類手法をそれぞれ評価した.その結果,景気動向を示す「根拠となる表現」の抽出手法に関しては適合率が71.43%,再現率が33.33%となり,分類手法に関してはPositive表現分類のF値が0.695,Negative表現分類のF値が0.849となった.
書き言葉を対象とした言語処理のための音声ドキュメントの文境界推定

太田貴久, 酒井浩之, 増山繁

音声ドキュメント処理ワークショップ講演論文集 1 159-166 2007年2月26日
経済新聞記事内容の個々の企業におけるインパクトの判定

酒井浩之, 増山繁

情報処理学会研究報告自然言語処理（NL） 2006(94) 43-50 2006年9月12日

新聞やインターネットなどで１日に配信される個々の企業に関する記事は膨大な数になるが，人間にとって重要な記事とは企業業績に影響を与えるほどのインパクトのある記事である．そのため，本研究では，経済新聞記事を対象とし，新聞に掲載される個々の企業の記事の内容を解析し，企業業績に影響を与えるほどのインパクトのある記事(以下，インパクト記事)であるかどうかを判定し，そのような記事を抽出する．また，インパクト記事の内容が企業業績にとってポジティブな影響を与えるか，ネガティブな影響を与えるかを自動的に判定する．さらに，本手法で抽出対象としている企業業績発表の記事の内容を解析し，その主要因（好調な事業，もしくは，不振の事業）が記載されている文を抽出する．本手法を評価したところ，インパクト記事抽出の精度は85.8%，再現率は66.8%であり，主要因(好調な事業，不振な事業)の記述のある文抽出の精度は82.2%，再現率は26.3%であった．Many articles about each company are distributed on the newspaper or Internet in a day.However,an important article for human is an article containing a story that influences the corporate performance.In this research,we propose a method for identifying an article containing a story that influences the corporate performance and extracting such articles from a newspaper corpus.Our method judges whether the story contained in the extracted article is positive or negative to the corporate performance.Moreover,we target the articles of the announcement on the corporate performance,we propose a method for extracting sentences containing its key factor(good business or bad business).Experimental results showed that our method for extracting articles containing a story that influences the corporate performance attained 85.8% precision and 66.8% recall and our method for extracting sentences containing the key factor attained 82.2% precision and 26.3% recall.
経済新聞記事内容の個々の企業におけるインパクトの判定

酒井浩之, 増山繁

情報処理学会研究報告情報学基礎（FI） 2006(94) 43-50 2006年9月12日

新聞やインターネットなどで１日に配信される個々の企業に関する記事は膨大な数になるが，人間にとって重要な記事とは企業業績に影響を与えるほどのインパクトのある記事である．そのため，本研究では，経済新聞記事を対象とし，新聞に掲載される個々の企業の記事の内容を解析し，企業業績に影響を与えるほどのインパクトのある記事(以下，インパクト記事)であるかどうかを判定し，そのような記事を抽出する．また，インパクト記事の内容が企業業績にとってポジティブな影響を与えるか，ネガティブな影響を与えるかを自動的に判定する．さらに，本手法で抽出対象としている企業業績発表の記事の内容を解析し，その主要因（好調な事業，もしくは，不振の事業）が記載されている文を抽出する．本手法を評価したところ，インパクト記事抽出の精度は85.8%，再現率は66.8%であり，主要因(好調な事業，不振な事業)の記述のある文抽出の精度は82.2%，再現率は26.3%であった．Many articles about each company are distributed on the newspaper or Internet in a day.However,an important article for human is an article containing a story that influences the corporate performance.In this research,we propose a method for identifying an article containing a story that influences the corporate performance and extracting such articles from a newspaper corpus.Our method judges whether the story contained in the extracted article is positive or negative to the corporate performance.Moreover,we target the articles of the announcement on the corporate performance,we propose a method for extracting sentences containing its key factor(good business or bad business).Experimental results showed that our method for extracting articles containing a story that influences the corporate performance attained 85.8% precision and 66.8% recall and our method for extracting sentences containing the key factor attained 82.2% precision and 26.3% recall.
Weblog 内のリンクに対する感情推定の試み : Web コミュニティ発見法改善の基礎として

松田耕史, 山本悠二, 酒井浩之, 増山繁

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 105(595) 13-18 2006年2月3日

Web上の情報量の増加とWeblogなどの簡易な情報発信手段の普及によって、Web上のリンクを単に「リンク先ページへの信頼」と解釈することはできなくなってきた。Web上のリンクに込められた感情を知ることによって、より密に連携したWebコミュニティを発見することが可能になると考えられる。そこで本研究では、Weblog内のリンクに対して、教師付き学習によって感情スコアを推定することを試みた。肯定的文書、否定的文書間の表現の偏りや、Weblog特有の文書構造を考慮した結果、ピアソンの相関係数で0.45程度と、かなりの相関をもって推測可能であることがわかった。
Knowledge acquisition about the deletion possibility of adnominal verb phrases

Hiroyuki Sakai, Shigeru Masuyama

Systems and Computers in Japan 37(2) 25-36 2006年2月
新聞記事からの交通事故事例および事故原因表現の抽出

酒井浩之, 梅村祥之, 増山繁

情報処理学会研究報告自然言語処理（NL） 2005(94) 85-92 2005年9月30日

新聞記事から交通事故事例の記事を抽出し，さらに，その中から事故原因を表す表現（例えば，「ハンドル操作を誤った」）を自動的に抽出する手法を提案する．本手法では，まず，Support Vector Machine（SVM）を用いて新開記事コーパスから交通事故事例の記事を抽出する．そして，抽出された交通事故事例の記事から事故原因を表す表現を抽出する．具体的には，事故原因を表す表現がいくつか係る表現を種表現と定義して人手で1つ与え，種表現に係っている事故原因表現を自動的に取得する．そして，取得したいくつかの事故原因表現から自動的に種表現を取得し，さらに，取得した種表現から再び事故原因表現を取得する．このプロセスを繰り返すことで，事故原因表現，および，その種表現を取得していく．本手法を評価したところ，交通事故事例抽出は精度82．0％，再現率84．3％であった．また，事故原因表現，および，種表現を共に含んでいる文を原因文と定義し，その抽出精度，再現率を求めたところ，精度が77．7％，再現率が39・8％であった．We propose a method for extracting articles concerning traffic accident and expressions concerning accident cause (e.g., "mishandling of the steering wheel control") from a. newspaper corpus. Our method extracts articles concerning traffic accident from a newspaper corpus by using SVMs, and extracts expressions concerning accident cause from the extracted articles. Here, we define an expression modified by expressions concerning accident cause as "a seed expression". Our method acquires expressions concerning accident cause from an initial seed expression provided manually. Moreover, our method acquires seed expressions from the expressions concerning accident cause and acquires new expressions concerning accident cause from the acquired seed expressions. By iterating these processes, expressions concerning accident cause and seed expressions are acquired. Experimental results showed that our method of extraction of articles concerning traffic accident from a newspaper corpus attained 82.0% precision and 84.3% recall. Here, we define a sentence containing both an expression concerning accident cause and a seed expression as a cause sentence and the precision and the recall of extraction of cause sentences attained 77.7% and 39.8% respectively.
新聞記事からの交通事故事例および事故原因表現の抽出

酒井浩之, 梅村祥之, 増山繁

情報処理学会研究報告情報学基礎（FI） 2005(94) 85-92 2005年9月30日

新聞記事から交通事故事例の記事を抽出し，さらに，その中から事故原因を表す表現（例えば，「ハンドル操作を誤った」）を自動的に抽出する手法を提案する．本手法では，まず，Support Vector Machine（SVM）を用いて新開記事コーパスから交通事故事例の記事を抽出する．そして，抽出された交通事故事例の記事から事故原因を表す表現を抽出する．具体的には，事故原因を表す表現がいくつか係る表現を種表現と定義して人手で1つ与え，種表現に係っている事故原因表現を自動的に取得する．そして，取得したいくつかの事故原因表現から自動的に種表現を取得し，さらに，取得した種表現から再び事故原因表現を取得する．このプロセスを繰り返すことで，事故原因表現，および，その種表現を取得していく．本手法を評価したところ，交通事故事例抽出は精度82．0％，再現率84．3％であった．また，事故原因表現，および，種表現を共に含んでいる文を原因文と定義し，その抽出精度，再現率を求めたところ，精度が77．7％，再現率が39・8％であった．We propose a method for extracting articles concerning traffic accident and expressions concerning accident cause (e.g., "mishandling of the steering wheel control") from a. newspaper corpus. Our method extracts articles concerning traffic accident from a newspaper corpus by using SVMs, and extracts expressions concerning accident cause from the extracted articles. Here, we define an expression modified by expressions concerning accident cause as "a seed expression". Our method acquires expressions concerning accident cause from an initial seed expression provided manually. Moreover, our method acquires seed expressions from the expressions concerning accident cause and acquires new expressions concerning accident cause from the acquired seed expressions. By iterating these processes, expressions concerning accident cause and seed expressions are acquired. Experimental results showed that our method of extraction of articles concerning traffic accident from a newspaper corpus attained 82.0% precision and 84.3% recall. Here, we define a sentence containing both an expression concerning accident cause and a seed expression as a cause sentence and the precision and the recall of extraction of cause sentences attained 77.7% and 39.8% respectively.
可読性の向上を目的とした片仮名表記の外来語に関する換言について

吉田辰巳, 遠間雄二, 増山繁, 酒井浩之

情報処理学会研究報告自然言語処理（NL） 2004(108) 53-58 2004年11月4日

近年，公的文書等における難解な片仮名語の乱用が問題視されている．片仮名語は従来日本語で用いられてきた語彙に換言可能な場合も多い．換言するための知識は人手で作成することもできるが，実用的な質と量を満たすためには，多大な労力を要する．そのため，換言知識は可能なかぎり自動的に獲得することが望ましい．以上より，本研究では，難解な片仮名語をより理解しやすい語へと言い換えるための換言知識を自動的に獲得する手法を提案，その有用性を確認した．In this paper, we report about knowledge acquisition of paraphrasing katakana words adopted from English for improving readability. Recently, the problem of using difficult katakana words in public documents has been drawing much attention. Mostly these words are from English. Moreover, they often have synonyms in Japanese. However, it is impossible to obtain rules manually because of time and effort. Therefore, we propose a method of paraphrasing katakana to Japanese words automatically. Experimental results show that recall 82.8% and precision 81.1% are attained for English words restoration, recall 14.6% and precision 70.8% are attained for acquisition of paraphrasing.
可読性の向上を目的とした片仮名表記の外来語に関する換言について

吉田辰巳, 遠間雄二, 増山繁, 酒井浩之

電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 104(416) 53-58 2004年10月28日

近年,公的文書等における難解な片仮名語の乱用が問題視されている.片仮名語は従来日本語で用いられてきた語彙に換言可能な場合も多い.換言するための知識は人手で作成することもできるが,実用的な質と量を満たすためには,多大な労力を要する.そのため,換言知識は可能なかぎり自動的に獲得することが望ましい.以上より,本研究では,難解な片仮名語をより理解しやすい語へと言い換えるための換言知識を自動的に獲得する手法を提案,その有用性を確認した.
A statistical method for acquiring knowledge about the abbreviation possibility of some of multiple adnominal phrases

H Sakai, S Masuyama

IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS E86D(9) 1710-1718 2003年9月
SVM（Support Vector Machine）を用いた経済記事の著者の見解に基づく分類

中嶋琢美, 酒井浩之, 増繁

情報処理学会研究報告情報学基礎（FI） 2003(51) 175-180 2003年5月22日

本研究では，著者の見解によるテキストの分類を目指す．今回は対象を経済記事とし，景気動向に対する見解別に分類を行った．分類は，最も単純な，景気が回復するであろうという見解と，景気が悪化するであろうという見解の2種類とした．景気が回復するであろうという見解の記事と，景気が悪化するであろうという見解の記事では，よく使用される語が異なるため，そこに着目した分類手法を考案した．本稿では手法と，実験結果について報告をする．実験の結果，語の頻度を素性値としたSVM(Support Vector Machine)を用いた手法で，良い結果が得られた．We propose a classification method of texts based on the view of the author. We treat newspaper articles on economics, and classify them into two classes, a class of articles where the author's view of each article is that business will recover, and a class of the author's view of each article that business will get worse, respectively.
コーパスからの名詞と略語の対応関係の自動獲得

酒井浩之

言語処理学会第9回年次大会発表表文集, 2003 2003年
省略可能な2重修飾表現の教師なし学習による自動獲得

酒井浩之, 増山繁

情報処理学会研究報告自然言語処理（NL） 2002(66) 179-184 2002年7月15日

文内要約の一要素技術として、省略可能な多重(連用・連体)修飾表現を、教師なしで自動的に獲得する手法を提案する.具体的には、(連用・連体)修飾表現と就職先の名詞や動詞との結合度を相互情報量を元にした計算式で重みとして計算する.そして、複数の修飾表現の重みの相対的な差で省略可能な修飾表現を認定する.すなわち、重みが最も大きい修飾表現を省略不可とし、それ以外の修飾表現は最も重みの大きい修飾表現との重みの差が大きいとき省略可能と認定する.評価実験によって、本手法による省略可能な多重連体修飾表現は、精度73.4％、再現率45.7％、多重連用修飾表現は、精度74.7％再現率42.9％であり、比較的、良好な精度を示した.This paper proposes an unsupervised method of acquiring knowledge about the abbreviation possibility of multiplex verb/noun phrases. Our method calculates weight values of verb/noun phrases and the weight values are calculated by mutual information based on degree of combination of verb/noun pharases and modified verbs/nouns. And, our method recognizes verb/noun phrases possible to be abbreviated by comparing weight values of verb/noun phrases. The evaluation of our method by experiments shows that the precision attains 73.4% and the recall attains 45.9% in case of noun phrases and the precision attains 74.7% and the recall attains 42.9% in case of verb phrases.

講演・口頭発表等

Extraction of sentences concerning business performance forecast and economic forecast from summaries of financial statements by deep learning

Shiori Kitamori, Hiroyuki Sakai, Hiroki Sakaji

IEEE Symposium on Computational Intelligence for Financial Engineering & Economics 2017年11月
Discovery of Rare Causal Knowledge from Financial Statement Summaries

Hiroki Sakaji, Risa Murono, Hiroyuki Sakai, Jason Bennett, Kiyoshi Izumi

IEEE Symposium on Computational Intelligence for Financial Engineering & Economics 2017年11月
Extracting Laboratory Front Pages from University Websites

Hiroki Sakaji, Atsuya Miyazaki, Hiroyuki Sakai, Kiyoshi Izumi

he 6th International Workshop on Web Services and Social Media In conjunction with The 20th International Conference on Network-Based Information Systems 2017年8月
Estimation of Tags via Comments on Nico Nico Douga

Hiroki Sakaji, Masaki Kohana, Akio Kobayashi, Hiroyuki Sakai

The 5th International Workshop on Web Services and Social Media In conjunction with the 19th International Conference on NBiS-2016 2016年9月
企業の決算短信ＰＤＦから抽出した業績要因への極性付与

酒井浩之, 小林義和, 坂地泰紀

第15回人工知能学会金融情報学研究会 2015年9月26日

もっとみる

担当経験のある科目(授業)

所属学協会

共同研究・競争的資金等の研究課題

決算短信やWEB情報を活用した就職支援のための企業検索システム

文部科学省科学研究費補助金(基盤研究(C)) 2015年 - 2018年

酒井浩之
特許文書からのクロスブートストラップによる表現抽出を用いたパテントマップ自動生成

日本学術振興会科学研究費助成事業 2010年 - 2012年

増山繁, 酒井浩之
投資判断支援のための業績要因自動抽出・分析手法の開発

文部科学省科学研究費補助金(若手研究(B)) 2009年 - 2011年

酒井浩之
入力文の分割・翻訳・連結による同時通訳システム

日本学術振興会科学研究費助成事業 2008年 - 2010年

稲垣康善, 松原茂樹, 加藤芳秀, 笠浩一朗, 大野誠寛, 酒井浩之
Research on the use of information by using large-scale information sources

The Other Research Programs 2005年 - 2010年

もっとみる

一覧へ戻る

酒井 浩之

基本情報

研究キーワード

研究分野

経歴

学歴

論文

MISC

講演・口頭発表等

担当経験のある科目(授業)

所属学協会

共同研究・競争的資金等の研究課題

酒井浩之