研究者業績

酒井 浩之

サカイ ヒロユキ  (Hiroyuki Sakai)

基本情報

所属
成蹊大学 理工学部 理工学科 教授
学位
博士(工学)(豊橋技術科学大学)

J-GLOBAL ID
200901074063121489
researchmap会員ID
5000031733

外部リンク

論文

 49
  • Hiroki Sakaji, Jason Bennett, Risa Murono, Kiyoshi Izumi, Hiroyuki Sakai 0003
    CoRR abs/2408.01748 2024年  
  • 高野海斗, 酒井浩之, 中川慧
    人工知能学会論文誌 36(1) WI2-G_1 2021年1月1日  査読有り
  • 酒井 浩之, 坂地 泰紀, 和泉 潔, 松井 藤五郎, 入江 圭太郎
    人工知能学会全国大会論文集 2020 1D3GS1303-1D3GS1303 2020年  
    <p>本研究では,業務の効率化の一環として,毎月のファンドの運用報告書に記載される市況分析コメントを生成するために必要な,要因文(日経平均株価が変動した要因について述べている文)を経済新聞記事から抽出する手法を提案する.本手法では,一ヶ月分の経済新聞記事を入力とし,深層学習により,その中から日経平均株価について言及した記事を判別し,さらに,判別された記事から要因文を抽出する.ここで,記事の判別,要因文の抽出を深層学習で行うために必要な学習データを自動生成することにより多くの学習データを作成し,高い精度を達成した.さらに,決算短信テキストより抽出した因果情報を用いることで,要因文に記載されている内容の補完情報の抽出を行っている.</p>
  • 高野 海斗, 酒井 浩之, 北島 良三
    人工知能学会論文誌 34(5) 1-22 2019年9月  査読有り
  • 酒井 浩之, 坂地 泰紀, 和泉 潔, 松井 藤五郎, 入江 圭太郎
    人工知能学会第二種研究会資料 2019(FIN-022) 61 2019年3月3日  
    本研究では、経済新聞記事などの経済テキストから、日経平均株価などの市況について言及している記事を抽出し、それらの内容を自動的に要約することによりマーケットレポートにおける市況分析コメントを自動生成する手法の開発を行う。しかし,日経平均株価の市況について言及している記事のみでは,指定した期間において重要な内容について言及している文の数が少なく,そのために重要な内容が市況分析コメントに含まれないことがある.そこで本研究では,ある期間において日経平均株価に影響を与えたイベントを推定し,そのイベントについて述べた記事を関連記事として自動的に検索し,検索された関連記事をも使用することで,生成する市況分析コメントの精度を高める手法を提案する.

MISC

 48
  • 坂地 泰紀, 和泉 潔, 酒井 浩之
    自然言語処理 = Journal of natural language processing 27(4) 951-955 2020年12月  
  • 酒井浩之, 坂地泰紀, 和泉潔, 松井藤五郎, 入江圭太郎
    人工知能学会全国大会(Web) 34th 2020年  
  • 室野 莉沙, 酒井 浩之, 坂地 泰紀, ベネット ジェイスン
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 117(207) 93-98 2017年9月7日  
  • 酒井 浩之, 松下 和暉
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 117(207) 87-91 2017年9月7日  
  • 坂地泰紀, 酒井浩之, 小林暁雄, 内田ゆず, 乙武北斗, 高丸圭一, 木村泰知
    言語処理学会第23回年次大会(NLP2017) 426-429 2017年3月  
  • 宮崎 敦也, 酒井 浩之, 坂地 泰紀
    成蹊大学理工学研究報告 53(2) 25-28 2016年12月  
    In this paper, we propose a method that extracts laboratory front pages from university web sites. Our method extracts the laboratory front pages by using SVM and applying some rules. Moreover, we developed the laboratory search system which is able to retrieve laboratory front pages extracted by our method. We evaluated our method and it attained 85.0% precision and 65.5% recall, respectively
  • 田中瑞竜, 酒井浩之, 坂地泰紀
    電子情報通信学会技術研究報告 116(213(NLC2016 13-28)) 19‐24 2016年9月1日  
  • 吉岡晋作, 坂地泰紀, 酒井浩之
    電子情報通信学会技術研究報告 115(445(NLC2015 44-53)) 1‐5 2016年1月28日  
  • 坂地泰紀, 所佳祐, 酒井浩之
    人工知能学会全国大会論文集(CD-ROM) 30th ROMBUNNO.1H2‐4 2016年  
  • 坂地泰紀, 小花聖輝, 小林暁雄, 酒井浩之
    ファジィシステムシンポジウム講演論文集(CD-ROM) 32nd ROMBUNNO.WD3‐3 2016年  
  • 酒井 浩之, 和泉 潔, 八木 勲, 西山 昇, 中山 慎一郎, 山本 竜市, 成蹊大学, 東京大学, 神奈川工科大学, Dragons' Desk Limited:千葉商科大学, / 早稲田大学
    人工知能 = journal of the Japanese Society for Artificial Intelligence 30(6) 784-784 2015年11月1日  
  • 宮崎敦也, 酒井浩之, 坂地泰紀
    電子情報通信学会技術研究報告 115(222(NLC2015 17-33)) 37-41 2015年9月3日  
  • 坂地泰紀, 酒井浩之
    電子情報通信学会技術研究報告 115(222(NLC2015 17-33)) 31-35 2015年9月3日  
  • 坂地 泰紀, 酒井 浩之, 増山 繁
    成蹊大学理工学研究報告 51(2) 23-27 2014年12月  
    This paper proposes a method that extracts causal knowledge from news paper articles via clue expressions. Our method decides whether a sentence includes causal knowledge or not when the method extracts it. Therefore, our method can extract causal knowledge accurately. Furthermore, the advantage of our decision method is to extract causal knowledge manually without dictionaries and patterns.
  • 中山 大, 坂地 泰紀, 勝田 研一郎, 酒井 浩之
    成蹊大学理工学研究報告 51(2) 53-60 2014年12月  
    This paper proposes a method of extracting important articles that influence the stock price of companies from financial articles. In the first step, our method obtains dates that have large difference from previous day at stock price of a selected company. In the second step, our method acquires articles that are published around the obtained dates and concern the selected company from financial articles. In the third step, our method extracts articles that influence the stock price of the selected company by using SVM as a machine learning method from the acquired articles. Finally, we evaluated our method. As a result, our method achieved 69.8% precision and 53.1% recall.
  • 石淵 準也, 坂地 泰紀, 酒井 浩之
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114(211) 17-21 2014年9月11日  
    本研究では,ニコニコ動画サイトに投稿された動画のコメントから,例えば「もっと評価されるべき」などのようなポジティブなコメントを自動的に抽出することを行った.ポジティブなコメントを自動的に抽出できることにより,例えば政見放送へのコメントの中からポジティブなコメントを得ることができ,政見放送の反応が即時に分析できるようになる.
  • 酒井 浩之, 坂地 泰紀
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114(211) 41-45 2014年9月11日  
    本論文では,企業Webページを対象とした企業検索システムにおいて,検索クエリに関連したタグを自動的に推定し,検索された企業ごとに推定されたタグを付与する手法を提案する.例えば検索クエリが「テキストマイニング」であれば,「開発」「提供」「導入」などのタグを推定する.そして,推定したタグを検索された企業に付与することで,例えば「テキストマイニング」技術を「開発」している企業を検索することができるようになる.
  • 柴原 啓太, 坂地 泰紀, 酒井 浩之
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 114(211) 75-79 2014年9月11日  
    近年,インターネットの発達により,動画共有サービスや動画配信サービスなどの動画サイトが普及している.本研究では,動画サイトの一つであるニコニコ動画を対象に,動画に付与されているタグ情報を用いて,動画に最適な日経プレスリリース記事を関連付けることで,効果的かつ効率的なインターネット広告の配信を目的とする.
  • 田原 如菜, 坂地 泰紀, 酒井 浩之
    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 113(429) 5-10 2014年1月30日  
    本研究では,キャラクターに対応する印象表現をTwitterから抽出する手法を提案する.具体的には,キャラクターとして,ゆるキャラを対象とし,キャラクター名に対応する印象表現(「可愛い」や「癒される」等)を抽出する.人手で印象表現辞書(喜,怒,哀,怖,恥,好,嫌,昂,驚,安,楽,その他のカテゴリーから成る363表現)を作成し,キャラクター名と印象表現辞書に存在する印象表現が含まれているツイートを取得する.そして,キャラクターごとに印象表現を抽出し,実際にアンケートで印象調査した結果と,本手法で抽出した印象表現を比べて評価した.
  • 坂地 泰紀, 酒井 浩之, 増山 繁
    人工知能学会全国大会論文集 28 1-4 2014年  
  • 西沢 裕子, 酒井 浩之
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113(213) 67-72 2013年9月12日  
    本研究では,企業のWebページで公開されている,決算短信のPDFファイルから業績要因を含む文を自動的に抽出する手法を提案する.業績要因を含む文とは,例えば「スマートフォンは引き続き拡大しました.」のような文とする.具体的には,経済新聞記事の業績発表記事から,業績要因を得るために自動的に抽出した手がかり表現(例えば,「が好調」など)と,抽出対象の企業のWebページから抽出したキーワードを用いることで,業績要因を自動抽出した.
  • 中山 大, 酒井 浩之
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113(213) 61-66 2013年9月12日  
    現在、個人投資家が増加している.しかし,すべての個人投資家が投資に対して知識や経験を持ち合わせているとは言い難い.そこで,本研究では,日本経済新聞記事より過去にある企業の(株)価に変動を与える重要な記事を自動で抽出する方法を提案した.具体的には,(株)価のデータより前日比を計算し,前日比が大きかった日付を取得する.取得した日付をもとに,その周辺の日付でその企業に関連した新聞記事を抽出する.そこから訓練データを作成し,訓練データに含まれる単語を素性とし,SVMにより生成した分類器で記事を分類する.評価実験では,F値が44となった.F値を上げるために,改良手法として,企業WEBページに含まれる単語を素性に加え,さらに,全実行結果より誤りとなった結果をもとに特徴を見つけ除去することも行った.再度評価したところ,F値は57,精度は73%となり,良好な結果が得られた.
  • 勝田 研一郎, 酒井 浩之
    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113(213) 13-16 2013年9月12日  
    本研究では,就職活動支援システムの一環として利用することを目指すために,企業WEBページから関連するキーワードを抽出する手法を提案する.ここで,抽出すべきキーワードとして,企業の行っている事業や関連する商品などとする.本手法では,企業のWEBページを収集し,その中に含まれている単語の中から,文書頻度などを使用して,事業と関連のあるキーワードのみを抽出する.
  • 坂地 泰紀, 増山 繁, 酒井 浩之
    情報処理学会研究報告 2010(2) 4p 2010年8月  
  • 坂地 泰紀, 増山 繁, 酒井 浩之
    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 110(142) 47-50 2010年7月15日  
    本論文では,新聞記事中の文が因果関係を含むか否かの判定を行う手法を提案する.手がかり表現を伴う因果関係に限定し,有無の判定を行う.因果関係を示す手がかり表現は,因果関係以外の意味を持っている場合がある.例えば,手がかり表現「から」は因果関係以外に,出発する位置を表す意味があり,「京都から大阪」などには因果関係は含まれない.このような因果関係を示す手がかり表現が含まれていても,因果関係以外の意味であるものを除くために,本手法を提案する.意味的な素性として拡張言語オントロジーを用いることと,学習データを自動的に増やすことにより,本手法の性能が向上した.
  • 西崎 海人, 酒井 浩之, 増山 繁
    人工知能学会全国大会論文集 24 1-4 2010年  
  • 坂地 泰紀, 野中 尋史, 酒井 浩之
    電子情報通信学会技術研究報告 109(142) 85-92 2009年7月22日  
  • 坂地 泰紀, 野中 尋史, 酒井 浩之, 増山 繁
    情報処理学会研究報告. 自然言語処理研究会報告 2009(14) 1-8 2009年7月15日  
    特許文書から直接的なユーザの便益に相当する表現と,技術上の解決課題を示す表現を自動的に抽出するアルゴリズム 「Cross-Bootstrapping」 を提案する.抽出した直接的なユーザの便益に相当する表現と,技術上の解決課題を示す表現はパテントマップを生成するために役立つ.本手法は,二つの手がかりと統計情報を用いて,ブートストラップ的に表現対を抽出する.また,辞書や人手により作成したパターンを用いず,自動的に表現を抽出することができる.最後に本手法の評価実験を行い,パテントマップを自動生成するために,十分な性能を達成したことを確認した.
  • 酒井 浩之, 野中 尋史, 増山 繁
    論文集 23 1-4 2009年  
  • 藤村 真太郎, 酒井 浩之, 増山 繁
    論文集 23 1-4 2009年  
  • 酒井 浩之, 増山 繁
    日本オペレーションズ・リサーチ学会春季研究発表会アブストラクト集 2008 116-117 2008年3月25日  
  • 酒井 浩之, 増山 繁
    人工知能学会全国大会論文集 22 1-4 2008年  
  • 坂地 泰紀, 酒井 浩之, 増山 繁
    日本オペレーションズ・リサーチ学会秋季研究発表会アブストラクト集 2007 194-195 2007年9月27日  
  • 坂地 泰紀, 酒井 浩之, 増山 繁
    情報処理学会研究報告. 自然言語処理研究会報告 2007(76) 151-156 2007年7月24日  
    本研究では,新聞記事から景気動向を示す「根拠となる表現」を統計的手法を用いて自動的に抽出する手法を提案する.また,抽出された景気動向を示す「根拠となる表現」を景気が回復することを示すPositive表現と悪化することを示すNegative表現に分類する手法も併せて提案する.企業や投資家にとって,株価や商品の売行きを予測するために,景気動向を知ることは重要なことである.そこで,我々は景気動向に関する記事から景気動向を示す「根拠となる表現」を抽出し,それを用いることにより,景気動向の予測が可能ではないかと考えた.今回,景気動向を予測するための材料として,景気動向の根拠となる表現を抽出し,それが景気が回復することを示すのか,悪化することを示すのかを判定する.我々は1990年から2005年の日経新聞を用いて実験し,景気動向を示す「根拠となる表現」の抽出手法と分類手法をそれぞれ評価した.その結果,景気動向を示す「根拠となる表現」の抽出手法に関しては適合率が71.43%,再現率が33.33%となり,分類手法に関してはPositive表現分類のF値が0.695, Negative表現分類のF値が0.849となった.
  • 坂地 泰紀, 酒井 浩之, 増山 繁
    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 107(158) 151-156 2007年7月17日  
    本研究では,新聞記事から景気動向を示す「根拠となる表現」を統計的手法を用いて自動的に抽出する手法を提案する.また,抽出された景気動向を示す「根拠となる表現」を景気が回復することを示すPositive表現と悪化することを示すNegative表現に分類する手法も併せて提案する.企業や投資家にとって,株価や商品の売行きを予測するために,景気動向を知ることは重要なことである.そこで,我々は景気動向に関する記事から景気動向を示す「根拠となる表現」を抽出し,それを用いることにより,景気動向の予測が可能ではないかと考えた.今回,景気動向を予測するための材料として,景気動向の根拠となる表現を抽出し,それが景気が回復することを示すのか,悪化することを示すのかを判定する.我々は1990年から2005年の日経新聞を用いて実験し,景気動向を示す「根拠となる表現」の抽出手法と分類手法をそれぞれ評価した.その結果,景気動向を示す「根拠となる表現」の抽出手法に関しては適合率が71.43%,再現率が33.33%となり,分類手法に関してはPositive表現分類のF値が0.695,Negative表現分類のF値が0.849となった.
  • 太田 貴久, 酒井 浩之, 増山 繁
    音声ドキュメント処理ワークショップ講演論文集 1 159-166 2007年2月26日  
  • 酒井 浩之, 増山 繁
    情報処理学会研究報告自然言語処理(NL) 2006(94) 43-50 2006年9月12日  
    新聞やインターネットなどで1日に配信される個々の企業に関する記事は膨大な数になるが,人間にとって重要な記事とは企業業績に影響を与えるほどのインパクトのある記事である.そのため,本研究では,経済新聞記事を対象とし,新聞に掲載される個々の企業の記事の内容を解析し,企業業績に影響を与えるほどのインパクトのある記事(以下,インパクト記事)であるかどうかを判定し,そのような記事を抽出する.また,インパクト記事の内容が企業業績にとってポジティブな影響を与えるか,ネガティブな影響を与えるかを自動的に判定する.さらに,本手法で抽出対象としている企業業績発表の記事の内容を解析し,その主要因(好調な事業,もしくは,不振の事業)が記載されている文を抽出する.本手法を評価したところ,インパクト記事抽出の精度は85.8%,再現率は66.8%であり,主要因(好調な事業,不振な事業)の記述のある文抽出の精度は82.2%,再現率は26.3%であった.Many articles about each company are distributed on the newspaper or Internet in a day.However,an important article for human is an article containing a story that influences the corporate performance.In this research,we propose a method for identifying an article containing a story that influences the corporate performance and extracting such articles from a newspaper corpus.Our method judges whether the story contained in the extracted article is positive or negative to the corporate performance.Moreover,we target the articles of the announcement on the corporate performance,we propose a method for extracting sentences containing its key factor(good business or bad business).Experimental results showed that our method for extracting articles containing a story that influences the corporate performance attained 85.8% precision and 66.8% recall and our method for extracting sentences containing the key factor attained 82.2% precision and 26.3% recall.
  • 酒井 浩之, 増山 繁
    情報処理学会研究報告情報学基礎(FI) 2006(94) 43-50 2006年9月12日  
    新聞やインターネットなどで1日に配信される個々の企業に関する記事は膨大な数になるが,人間にとって重要な記事とは企業業績に影響を与えるほどのインパクトのある記事である.そのため,本研究では,経済新聞記事を対象とし,新聞に掲載される個々の企業の記事の内容を解析し,企業業績に影響を与えるほどのインパクトのある記事(以下,インパクト記事)であるかどうかを判定し,そのような記事を抽出する.また,インパクト記事の内容が企業業績にとってポジティブな影響を与えるか,ネガティブな影響を与えるかを自動的に判定する.さらに,本手法で抽出対象としている企業業績発表の記事の内容を解析し,その主要因(好調な事業,もしくは,不振の事業)が記載されている文を抽出する.本手法を評価したところ,インパクト記事抽出の精度は85.8%,再現率は66.8%であり,主要因(好調な事業,不振な事業)の記述のある文抽出の精度は82.2%,再現率は26.3%であった.Many articles about each company are distributed on the newspaper or Internet in a day.However,an important article for human is an article containing a story that influences the corporate performance.In this research,we propose a method for identifying an article containing a story that influences the corporate performance and extracting such articles from a newspaper corpus.Our method judges whether the story contained in the extracted article is positive or negative to the corporate performance.Moreover,we target the articles of the announcement on the corporate performance,we propose a method for extracting sentences containing its key factor(good business or bad business).Experimental results showed that our method for extracting articles containing a story that influences the corporate performance attained 85.8% precision and 66.8% recall and our method for extracting sentences containing the key factor attained 82.2% precision and 26.3% recall.
  • 松田 耕史, 山本 悠二, 酒井 浩之, 増山 繁
    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 105(595) 13-18 2006年2月3日  
    Web上の情報量の増加とWeblogなどの簡易な情報発信手段の普及によって、Web上のリンクを単に「リンク先ページへの信頼」と解釈することはできなくなってきた。Web上のリンクに込められた感情を知ることによって、より密に連携したWebコミュニティを発見することが可能になると考えられる。そこで本研究では、Weblog内のリンクに対して、教師付き学習によって感情スコアを推定することを試みた。肯定的文書、否定的文書間の表現の偏りや、Weblog特有の文書構造を考慮した結果、ピアソンの相関係数で0.45程度と、かなりの相関をもって推測可能であることがわかった。
  • Hiroyuki Sakai, Shigeru Masuyama
    Systems and Computers in Japan 37(2) 25-36 2006年2月  
    We propose a method of acquiring knowledge about the possibility of deletion of adnominal verb phrases from a corpus. Our method acquires such items as the frequency of modification of the noun by adnominal verb phrases and the variety of adnominal verb phrases modifying the noun, from a newspaper corpus, and yields knowledge about the possibility of deletion of adnominal verb phrases by using their statistical information. Our method also identifies adnominal verb phrases modifying nouns with important content as deletable ones. Experimental results show that the precision and the recall attained 77.3% and 69.4%, respectively. © 2006 Wiley Periodicals, Inc.
  • 酒井 浩之, 梅村 祥之, 増山 繁
    情報処理学会研究報告自然言語処理(NL) 2005(94) 85-92 2005年9月30日  
    新聞記事から交通事故事例の記事を抽出し,さらに,その中から事故原因を表す表現(例えば,「ハンドル操作を誤った」)を自動的に抽出する手法を提案する.本手法では,まず,Support Vector Machine(SVM)を用いて新開記事コーパスから交通事故事例の記事を抽出する.そして,抽出された交通事故事例の記事から事故原因を表す表現を抽出する.具体的には,事故原因を表す表現がいくつか係る表現を種表現と定義して人手で1つ与え,種表現に係っている事故原因表現を自動的に取得する.そして,取得したいくつかの事故原因表現から自動的に種表現を取得し,さらに,取得した種表現から再び事故原因表現を取得する.このプロセスを繰り返すことで,事故原因表現,および,その種表現を取得していく.本手法を評価したところ,交通事故事例抽出は精度82.0%,再現率84.3%であった.また,事故原因表現,および,種表現を共に含んでいる文を原因文と定義し,その抽出精度,再現率を求めたところ,精度が77.7%,再現率が39・8%であった.We propose a method for extracting articles concerning traffic accident and expressions concerning accident cause (e.g., "mishandling of the steering wheel control") from a. newspaper corpus. Our method extracts articles concerning traffic accident from a newspaper corpus by using SVMs, and extracts expressions concerning accident cause from the extracted articles. Here, we define an expression modified by expressions concerning accident cause as "a seed expression". Our method acquires expressions concerning accident cause from an initial seed expression provided manually. Moreover, our method acquires seed expressions from the expressions concerning accident cause and acquires new expressions concerning accident cause from the acquired seed expressions. By iterating these processes, expressions concerning accident cause and seed expressions are acquired. Experimental results showed that our method of extraction of articles concerning traffic accident from a newspaper corpus attained 82.0% precision and 84.3% recall. Here, we define a sentence containing both an expression concerning accident cause and a seed expression as a cause sentence and the precision and the recall of extraction of cause sentences attained 77.7% and 39.8% respectively.
  • 酒井 浩之, 梅村 祥之, 増山 繁
    情報処理学会研究報告情報学基礎(FI) 2005(94) 85-92 2005年9月30日  
    新聞記事から交通事故事例の記事を抽出し,さらに,その中から事故原因を表す表現(例えば,「ハンドル操作を誤った」)を自動的に抽出する手法を提案する.本手法では,まず,Support Vector Machine(SVM)を用いて新開記事コーパスから交通事故事例の記事を抽出する.そして,抽出された交通事故事例の記事から事故原因を表す表現を抽出する.具体的には,事故原因を表す表現がいくつか係る表現を種表現と定義して人手で1つ与え,種表現に係っている事故原因表現を自動的に取得する.そして,取得したいくつかの事故原因表現から自動的に種表現を取得し,さらに,取得した種表現から再び事故原因表現を取得する.このプロセスを繰り返すことで,事故原因表現,および,その種表現を取得していく.本手法を評価したところ,交通事故事例抽出は精度82.0%,再現率84.3%であった.また,事故原因表現,および,種表現を共に含んでいる文を原因文と定義し,その抽出精度,再現率を求めたところ,精度が77.7%,再現率が39・8%であった.We propose a method for extracting articles concerning traffic accident and expressions concerning accident cause (e.g., "mishandling of the steering wheel control") from a. newspaper corpus. Our method extracts articles concerning traffic accident from a newspaper corpus by using SVMs, and extracts expressions concerning accident cause from the extracted articles. Here, we define an expression modified by expressions concerning accident cause as "a seed expression". Our method acquires expressions concerning accident cause from an initial seed expression provided manually. Moreover, our method acquires seed expressions from the expressions concerning accident cause and acquires new expressions concerning accident cause from the acquired seed expressions. By iterating these processes, expressions concerning accident cause and seed expressions are acquired. Experimental results showed that our method of extraction of articles concerning traffic accident from a newspaper corpus attained 82.0% precision and 84.3% recall. Here, we define a sentence containing both an expression concerning accident cause and a seed expression as a cause sentence and the precision and the recall of extraction of cause sentences attained 77.7% and 39.8% respectively.
  • 吉田 辰巳, 遠間雄二, 増山 繁, 酒井 浩之
    情報処理学会研究報告自然言語処理(NL) 2004(108) 53-58 2004年11月4日  
    近年,公的文書等における難解な片仮名語の乱用が問題視されている.片仮名語は従来日本語で用いられてきた語彙に換言可能な場合も多い.換言するための知識は人手で作成することもできるが,実用的な質と量を満たすためには,多大な労力を要する.そのため,換言知識は可能なかぎり自動的に獲得することが望ましい.以上より,本研究では,難解な片仮名語をより理解しやすい語へと言い換えるための換言知識を自動的に獲得する手法を提案,その有用性を確認した.In this paper, we report about knowledge acquisition of paraphrasing katakana words adopted from English for improving readability. Recently, the problem of using difficult katakana words in public documents has been drawing much attention. Mostly these words are from English. Moreover, they often have synonyms in Japanese. However, it is impossible to obtain rules manually because of time and effort. Therefore, we propose a method of paraphrasing katakana to Japanese words automatically. Experimental results show that recall 82.8% and precision 81.1% are attained for English words restoration, recall 14.6% and precision 70.8% are attained for acquisition of paraphrasing.
  • 吉田 辰巳, 遠間 雄二, 増山 繁, 酒井 浩之
    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 104(416) 53-58 2004年10月28日  
    近年,公的文書等における難解な片仮名語の乱用が問題視されている.片仮名語は従来日本語で用いられてきた語彙に換言可能な場合も多い.換言するための知識は人手で作成することもできるが,実用的な質と量を満たすためには,多大な労力を要する.そのため,換言知識は可能なかぎり自動的に獲得することが望ましい.以上より,本研究では,難解な片仮名語をより理解しやすい語へと言い換えるための換言知識を自動的に獲得する手法を提案,その有用性を確認した.
  • 中嶋 琢美, 酒井 浩之, 増 繁
    情報処理学会研究報告情報学基礎(FI) 2003(51) 175-180 2003年5月22日  
    本研究では,著者の見解によるテキストの分類を目指す.今回は対象を経済記事とし,景気動向に対する見解別に分類を行った.分類は,最も単純な,景気が回復するであろうという見解と,景気が悪化するであろうという見解の2種類とした.景気が回復するであろうという見解の記事と,景気が悪化するであろうという見解の記事では,よく使用される語が異なるため,そこに着目した分類手法を考案した.本稿では手法と,実験結果について報告をする.実験の結果,語の頻度を素性値としたSVM(Support Vector Machine)を用いた手法で,良い結果が得られた.We propose a classification method of texts based on the view of the author. We treat newspaper articles on economics, and classify them into two classes, a class of articles where the author's view of each article is that business will recover, and a class of the author's view of each article that business will get worse, respectively.
  • IEICE Transactions on Information and Systems vol.E86-D, no.9, pp.1710-1718 2003年  
  • 酒井 浩之, 増山 繁
    情報処理学会研究報告自然言語処理(NL) 2002(66) 179-184 2002年7月15日  
    文内要約の一要素技術として、省略可能な多重(連用・連体)修飾表現を、教師なしで自動的に獲得する手法を提案する.具体的には、(連用・連体)修飾表現と就職先の名詞や動詞との結合度を相互情報量を元にした計算式で重みとして計算する.そして、複数の修飾表現の重みの相対的な差で省略可能な修飾表現を認定する.すなわち、重みが最も大きい修飾表現を省略不可とし、それ以外の修飾表現は最も重みの大きい修飾表現との重みの差が大きいとき省略可能と認定する.評価実験によって、本手法による省略可能な多重連体修飾表現は、精度73.4%、再現率45.7%、多重連用修飾表現は、精度74.7%再現率42.9%であり、比較的、良好な精度を示した.This paper proposes an unsupervised method of acquiring knowledge about the abbreviation possibility of multiplex verb/noun phrases. Our method calculates weight values of verb/noun phrases and the weight values are calculated by mutual information based on degree of combination of verb/noun pharases and modified verbs/nouns. And, our method recognizes verb/noun phrases possible to be abbreviated by comparing weight values of verb/noun phrases. The evaluation of our method by experiments shows that the precision attains 73.4% and the recall attains 45.9% in case of noun phrases and the precision attains 74.7% and the recall attains 42.9% in case of verb phrases.
  • 酒井 浩之, 増山 繁
    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 102(200) 81-86 2002年7月9日  
    文内要約の一要素技術として,省略可能な多重(連用・連体)修飾表現を,教師なしで自動的に獲得する手法を提案する.具体的には,(連用・連体)修飾表現と修飾先の名詞や動詞との結合度を相互情報量を元にした計算式で重みとして計算する.そして,複数の修飾表現の重みの相対的な差で省略可能な修飾表現を認定する.すなわち,重みが最も大きい修飾表現を省略不可とし,それ以外の修飾表現は最も重みの大きい修飾表現との重みの差が大きいとき省略可能と認定する.評価実験によって,本手法による省略可能な多重連体修飾表現は,精度73.4%,再現率45.7%,多重連用修飾表現は,精度74.7%,再現率42.9%であり,比較的,良好な精度を示した.

講演・口頭発表等

 60

担当経験のある科目(授業)

 4

共同研究・競争的資金等の研究課題

 5