研究者業績

大島 裕明

オオシマ ヒロアキ  (Hiroaki Ohshima)

基本情報

所属
兵庫県立大学 大学院情報科学研究科 准教授
学位
博士(情報学)(京都大学)

研究者番号
90452317
J-GLOBAL ID
201401077923568388
researchmap会員ID
7000008756

論文

 135

MISC

 205
  • 大島 裕明, 田中 克己
    電子情報通信学会, 第1回データ工学と情報マネジメントに関するフォーラム (DEIM Forum 2009) B9-1 2009年3月  
  • 加藤 誠, 大島 裕明, 小山 聡, 田中 克己
    情報処理学会, Webとデータベースに関するフォーラム2008 (WebDB Forum 2008) 3A-2 2008年12月  査読有り
  • Hiroaki Ohshima, Adam Jatowt, Satoshi Oyama, Katsumi Tanaka
    電子情報通信学会技術研究報告 108(211) 31-32 2008年9月  
    Mining search engines for different kinds of relationships between entities, such as coordinate relation-ships, has recently attracted much research interest. However, detecting the evolution of such relationships over time has not been researched well. Certain document repositories, such as news archives or blog collections often enable temporal search functionality that can deliver results with respect to selected temporal constraints. In this paper, we demonstrate a method for detecting changes in coordinate terms over time by mining a large news archive through its search interface. We present also a visualization system that lets users explore and understand the evolution of coordinate relationships between different entities.
  • 大島 裕明, 田中 克己
    情報処理学会研究報告 2008(88, 2008-DBS-146) 37-42 2008年9月  
    本稿では,1 語が与えられたときに, Web 検索を利用して,与えられた語とある特定の関係にある語 (以後,関連語と呼ぶ) を発見する手法について提案を行う.関連語とは,例えば,上位語,下位語,類義語,同位語などのことであり,話題語や詳細語のように定義が曖昧な語や,略語なども含むものとする.提案手法では, Web 検索エンジンの結果として得られるテキストを情報源として関連語を発見する.検索クエリにおいて,発見したい関連語が特徴的に現れる構文パターンを複数用いることにより, Web 検索結果という少ない量のテキストからでも比較的精度良く,高速に語の発見を行うことが可能となる.We propose a method for discovering related terms using Web search engines. Related terms are, for example, hypernyms, hyponyms, synonyms, coordinate terms, topic terms, and abbreviations. The proposed method uses text resources from Web search results only. Bi-directional syntax patterns are used for Web search queries and for extracting related terms from Web search results. A system using our method has a relatively high speed and good precision.
  • 中谷 誠, Adam Jatowt, 大島 裕明, 田中 克己
    情報処理学会研究報告 2008(88, 2008-DBS-146) 253-258 2008年9月  
    検索語が属する分野における専門語は,ユーザが検索結果に含まれるウェブページの内容を理解する上で重要な役割を持っている.専門語が多く含まれるウェブページは,非専門家ユーザにとっては理解しづらいが,一方で専門家ユーザにとっては読みやすく詳細な情報を得る上で有用である.本研究では, Wikipedia のリンク構造とカテゴリ構造を用いて,ユーザの入力した検索語からその語に関する専門語を抽出する手法について述べる. Wikipedia 中で検索語が含まれている記事のカテゴリ情報を集約することによって検索語の属する専門領域を検出し,その領域の内外でリンクの出現頻度を分析することによって専門語を抽出する.本研究の提案手法は幅広い分野を網羅しており多言語対応している Wikipedia を用いているので,検索語の分野や言語に関係なく専門語を取得することができる.Technical terms for query keywords are important for users to grasp the meaning of the contents of Web pages included in search results. In particular, Web pages with many technical terms are difficult to be understood by non-expert users, yet, they are rather readable and useful for expert users who can acquire detailed information from them. This paper proposes a method for extracting technical terms for query keywords by using link and category structure of Wikipedia. We detect technical domains of query keywords by aggregating category information of Wikipedia articles and we extract technical terms by analyzing link frequency in inside and outside of the domains. Since our proposed method uses Wikipedia, thus it is domain-independent covering many different topics and it does not depend on particular language of query keywords.
  • 大島 裕明, 中村 聡史, 赤星 祐平, 中田 秀基, 喜連川 優, 田中 克己
    情報処理学会会誌「情報処理」 49(8) 49-52 2008年8月  招待有り
  • 大島 裕明
    情報処理 49(6) 70-70 2008年6月  招待有り
  • 赤星 祐平, 大島 裕明, 木俵 豊, 田中 克己
    情報処理学会 第70回全国大会講演論文集 1J-3 2008年3月  
  • 加藤 誠, 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会, 第19回データ工学ワークショップ (DEWS 2008) B9-6 2008年3月  
  • 小林 卓弥, 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会, 第19回データ工学ワークショップ (DEWS 2008) B8-4 2008年3月  
  • 赤星 祐平, 大島 裕明, 木俵 豊, 田中 克己
    電子情報通信学会, 第19回データ工学ワークショップ (DEWS 2008) D7-6 2008年3月  
  • 金子 恭史, 中村 聡史, 大島 裕明, 田中 克己
    電子情報通信学会, 第19回データ工学ワークショップ (DEWS 2008) B7-2 2008年3月  
  • 中岡 美華, 大島 裕明, 田中克己
    電子情報通信学会, 第19回データ工学ワークショップ (DEWS 2008) B7-1 2008年3月  
  • 稲川 雅之, 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会, 第19回データ工学ワークショップ (DEWS 2008) A7-4 2008年3月  
  • 甲谷 優, 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会, 第19回データ工学ワークショップ (DEWS 2008) B3-6 2008年3月  
  • 稲川 雅之, 大島 裕明, 小山 聡, 田中 克己
    情報処理学会, データベースとWeb情報システムに関するシンポジウム2007 (DBWeb 2007) 7B-2 2007年11月  査読有り
  • 服部 峻, 大島 裕明, 小山 聡, 田中 克己
    情報処理学会研究報告 2007(65, 2007-DBS-143) 127-132 2007年7月  
    概念間の階層関係は自然言語処理システムにおいて非常に重要な知識であり,Webなどの大量の文書コーパスをテキストマイニングすることで概念階層を自動抽出する研究が盛んに行われている.しかしながら,従来手法の多くは,特定の構文パターンに合致する記述が文書コーパス中に多く含まれるという階層関係の十分条件に基づいており,より厳密な構文パターンを用いると適合率は高いが再現率は低く,より緩い構文パターンを用いると再現率は改善されるが適合率を著しく損なってしまう.本稿で我々は,再現率を改善しつつ適合率も維持するために,上位下位関係の必要十分条件として概念間の性質の継承関連を仮定する.ある概念間に対して,各々の概念の典型的な性質を求めた上で,互いへ性質が継承される度合いを評価することで,上位下位関係の有無を判定する.さらに,一方の概念を上位概念と仮定した場合に,もう一方の概念への性質の継承度を評価するだけでなく,その同位概念への性質の継承度も合わせて評価することで,概念間の上位下位関係をより厳密に抽出する手法を提案する.
  • 大島 裕明, 小山 聡, 田中 克己
    情報処理学会研究報告 2007(65, 2007-DBS-143) 295-300 2007年7月  
    本稿では、「Web 集約質問」を処理するための Web 検索エンジンに対する関係データベースインターフェースを提案する。Web 検索の目的がページを発見することであるのに対して、Web 集約質問処理では Web 全体における集約された情報を取得することを目的とする。Web 集約質問処理には、(1) Web 検索、(2) 自然言語処理(NLP)によるデータ抽出、(3) 情報集約といった機能が必要である。関係データベースシステムはすでに強力な集約機能を保有しているため、我々は関係データベース上に Web 検索や自然言語処理機能のためのインターフェースを実装した。ユーザは SQL によって、アドホックな Web 集約質問処理や、そこで得られる知識とローカルデータベース上の既存のデータとの結合を行うことが可能となる。本稿では、これらのインターフェースの設計と実装、それを利用したアプリケーションについて述べる。We propose a relational database interface to conventional Web search engines for processing "Web aggregate queries". Whereas the purpose of a Web search is usually to find specific Web pages, the purpose of processing a Web aggregate query is to obtain aggregated information from the overall Web. To process Web aggregate queries, we need several functions such as (1) Web searching, (2) natural language processing for text extraction, and (3) aggregation of data. Because a relational database system has a robust aggregation capability, we implemented a relational database interface to conventional Web search engines with a natural language processing capability. Using SQL through the relational interface, users can formulate and execute several ad hoc SQL queries. Local databases can also be joined with Web search results through the relational database interface. We describe the design and implementation of the relational database interface, and its applications.
  • 小林 卓弥, 大島 裕明, 小山 聡, 田中 克己
    情報処理学会研究報告 2007(65, 2007-DBS-143) 211-216 2007年7月  
    CGMにおける評判情報からレビュアーの「生活圏」を抽出し,それに基づくレビュー情報の評価方法を提案する.今回は飲食店評価をその対象情報とし,実際にレビュアーの「生活圏」の特定を行った.今後は「生活圏」内のレビューと「生活圏」外のレビューは異なる情報価値を有しているという考えの下に,複合的に「生活圏」を利用した,レビュー情報の評価方法を検討していく.
  • 大島 裕明, 中村 聡史, 田中 克己
    電子情報通信学会, 第18回データ工学ワークショップ (DEWS 2007) C7-10 2007年3月  査読有り
  • 大島 裕明, 山口 雅史, 小山 聡, 田中 克己
    情報処理学会, DBWeb 2006シンポジウム論文集 305-312 2006年12月  査読有り
  • 河重 貴洋, 大島 裕明, 小山 聡, 田島 敬史, 田中 克己
    電子情報通信学会技術研究報告. DE, データ工学 106(150) 7-12 2006年7月7日  
    ある電子メールを閲覧している際に,これまでに受信したメールや,インターネット上の情報など,そのメールの中には含まれない情報がユーザに必要となることがある.これまで,そのようなユーザが必要とする情報は自分で検索する必要があった.そこで本研究では,閲覧中のメール,および,これまでに受信したメールを解析することで,閲覧メールの情報を補完する情報を持ったメールを自動的に検索・提示する手法を提案する.提案手法においては閲覧中のメールを補完するメールを抽出するために,メールデータ中のある日時区間に受信したメールにおけるキーワードの出現数に着目し,話題となる語の特定を行う.そして,同じ話題を持つメールを解析することで,その話題語に対する詳細語の発見を行う.この詳細語に基づいて補完するメールを検索し,ユーザに補完情報の提示を行う.
  • 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会技術研究報告. DE, データ工学 106(149) 119-124 2006年7月6日  
    本研究では,ユーザが保有している文書のいくつかをクエリとして,それらのカテゴリと兄弟カテゴリにあたるような文書を,Web上から取得する手法について提案を行う.ある分野について網羅的に調べているときなど,自分がすでに知っている情報と関連するが少し異なるような文書,すなわち,自分が保有している文書が属するカテゴリに対して兄弟カテゴリに属するような文書を検索したい場合がある.そのような兄弟カテゴリ文書を検索するために,我々はこれまで,ユーザが持っている文書をクエリとしたときにどのような文書が兄弟カテゴリ文書として適しているかを評価する手法について研究を行ってきた.本稿では,ユーザがクエリとして与えた文書群からWeb検索エンジンに対するクエリを作成して,Web上にある兄弟カテゴリの文書として適する可能性がある文書を効率よく収集する手法について提案する.これまで行ってきた評価手法の研究の成果と本提案を用いることでWebから兄弟カテゴリの文書を効率よく取得可能となる.
  • 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会技術研究報告. DE, データ工学 106(149) 125-130 2006年7月6日  
    本研究では,Web検索を用いて同位語を発見するための手法について提案する.同位語とは,共通の上位語を持つような語のことである.従来研究として,同位語や上位語,下位語などを求めるようなものはいくつも存在するが,それらのほとんどは巨大なコーパスに対して大量の計算を行い,その結果として大量の結果を取得するというものであった.それに対して我々の提案は,Web検索を用いることによって,何の事前処理もなしにあらゆる分野の語に対して素早く同位語を発見する手法である.ある語に対する同位語が並列助詞「や」で接続されることに着目し,そのような部分を含んだ文章を非常に少ない回数のWeb検索を用いて収集し,そこから同位語を発見する.また,検索された語に対してクエリの語との間にどのような背景コンテキストがあるかを提示することも行っている.
  • 小谷 彬, 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会技術研究報告. DE, データ工学 106(149) 35-40 2006年7月6日  
    Webサイトには効率よく必要な情報を得るために,サイトマップが存在し,そのサイトの構造や内容に基づいて情報が整理され提示されている.ユーザにとっては,それが複数のWebサイト間で同様の形式で整理されていることが望ましい.なぜなら類似したWebサイト間において,共通の項目に関するページを比較して閲覧することは,ユーザにとって負担であり困難でもあるからである.そこで我々は複数のWebサイト間における共通属性を抽出し,その共通属性の各属性に該当するWebページを抽出する手法を提案する.その結果,複数のWebサイトに共通のサイトマップが生成できることになる.共通属性抽出においては,属性を一語で表すための手法について述べ,さらに属性間の階層化や類似属性の統合のために,複数の語で属性を現す属性拡張の手法についても述べる.
  • 野田 武史, 大島 裕明, 小山 聡, 田島 敬史, 田中 克己
    電子情報通信学会技術研究報告. DE, データ工学 106(149) 239-244 2006年7月6日  
    われわれが検索の対象とする語には,それについて関連のある話題を表すような別の語を考えることができる.たとえば,京都という語について考えた場合,その話題として「観光」や「グルメ」,「写真」,「ホテル」などが考えられる.本研究では最初に対象とした語を主題語,それに関連する話題を表す語を話題語と呼び,Web上の情報を利用して主題語に関連する話題語を自動抽出するとともに,その話題に関する情報を提供しているWebページを検索する手法について考察する.
  • 山口 雅史, 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会技術研究報告. DE, データ工学 106(148) 121-126 2006年7月5日  
    サーチエンジンのクエリログを用いて,ある語の同位語や話題語を発見する手法を提案する.同位語とは共通の上位語を持つような語のことである.従来研究にも,同位語や,上位語,下位語を求めるようなものは数多くある.しかし,それらは大量のコーパスを用いるもの,または,膨大な計算処理が必要なものがほとんどであった.それに対して我々は,サーチエンジンのもつメタデータの一種であるクエリログのみを用いて,効率よく同位語を発見し,それらの話題となる語を発見する手法を提案する.ユーザが入力する検索クエリにおいて,ある語とその同位語となる語とはしばしば同様の語を用いて絞り込みをされることに着目し,効率よく同位語を発見する.また,得られた結果を視覚化し分かりやすく提示することも行う.
  • 山口 雅史, 大島 裕明, 小山 聡, 田中 克己
    情報処理学会研究報告 2006(77, 2006-DBS-140(I)) 147-154 2006年7月  
    サーチエンジンのクエリログを用いて,ある語の同位語や話題語を発見する手法を提案する.同位語とは共通の上位語を持つような語のことである.従来研究にも,同位語や,上位語,下位語を求めるようなものは数多くある.しかし,それらは大量のコーパスを用いるもの,または,膨大な計算処理が必要なものがほとんどであった.それに対して我々は,サーチエンジンのもつメタデータの一種であるクエリログのみを用いて 効率よく同位語を発見し,それらの話題となる語を発見する手法を提案する.ユーザが入力する検索クエリにおいて,ある語とその同位語となる語とはしばしば同様の語を用いて絞り込みをされることに着目し,効率よく同位語を発見する.また,得られた結果を視覚化し分かりやすく提示することも行う.We propose a method for searching coordinate terms and topic terms by using search engine query logs. "Coordinate terms" are terms which have the same hypernym. There are several researches that acquire coordinate terms, but they need parsed corpora or much time for computation. Our proposing method only needs a query log, which is one of a metadata of Web search engine, and relatively few times for computation to obtain coordinate terms and topic terms. We also visualize obtained coordinate terms and topic terms by using a graph layout algorithm.
  • 野田 武史, 大島 裕明, 小山 聡, 田島敬史, 田中 克己
    情報処理学会研究報告 2006(77, 2006-DBS-140(II)) 305-311 2006年7月  
    われわれが検索の対象とする語には,それについて関連のある話題を表すような別の語を考えることができる.たとえば,京都という語について考えた場合,その話題として「観光」や「グルメ」,「写真」,「ホテル」などが考えられる.本研究では最初に対象とした語を主題語,それに関連する話題を表す語を話題語と呼び,Web上の情報を利用して主題語に関連する話題語を自動抽出するとともに,その話題に関する情報を提供しているWebページを検索する手法について考察する.When we search something in the Web, we choose some keywords to verbalize it. Generally, for every keyword we can thik of other keywords which represent a ``topic'' of them. For example, if we want to know something about Kyoto and choose the word ``Kyoto'' for initial keyword, then we can think of other keywords like ``sightseeing'', ``gourmet'', ``photo'' or ``hetel'' which describe some specific aspects of Kyoto, a ``topic'' in other words. In this research we call the initial keywords ``Theme terms'' and latter associated keywords ``Topic terms''. We discussed how we could find topic terms for a specific theme term from the Web and tryied to find appropriate Web pages those were to be addressed by the theme term and topic term.
  • 大島 裕明, 小山 聡, 田中 克己
    情報処理学会研究報告 2006(77, 2006-DBS-140(II)) 161-168 2006年7月  
    本研究では,Web 検索を用いて同位語を発見するための手法について提案する.同位語とは,共通の上位語を持つような語のことである.従来研究として,同位語や上位語,下位語などを求めるようなものはいくつも存在するが,それらのほとんどは巨大なコーパスに対して大量の計算を行い,その結果として大量の結果を取得するというものであった.それに対して我々の提案は,Web 検索を用いることによって,何の事前処理もなしにあらゆる分野の語に対して素早く同位語を発見する手法である.ある語に対する同位語が並列助詞「や」で接続されることに着目し,そのような部分を含んだ文章を非常に少ない回数のWeb 検索を用いて収集し,そこから同位語を発見する.また,検索された語に対してクエリの語との間にどのような背景コンテキストがあるかを提示することも行っている.本研究では,ユーザが保有している文書のいくつかをクエリとして,それらのカテゴリと兄弟カテゴリにあたるような文書を,Web 上から取得する手法について提案を行う.ある分野について網羅的に調べているときなど,自分がすでに知っている情報と関連するが少し異なるような文書,すなわち,自分が保有している文書が属するカテゴリに対して兄弟カテゴリに属するような文書を検索したい場合がある.そのような兄弟カテゴリ文書を検索するために,我々はこれまで,ユーザが持っている文書をクエリとしたときにどのような文書が兄弟カテゴリ文書として適しているかを評価する手法について研究を行ってきた.本稿では,ユーザがクエリとして与えた文書群からWeb 検索エンジンに対するクエリを作成して,Web 上にある兄弟カテゴリの文書として適する可能性がある文書を効率よく収集する手法について提案する.これまで行ってきた評価手法の研究の成果と本提案を用いることでWeb から兄弟カテゴリの文書を効率よく取得可能となる.We propose a method for searching coordinate terms by using Web search engine indices. "Coordinate terms" are terms which have the same hypernym. There are several researches that acquire coordinate terms, but they need parsed corpora or take much time for computation. Our implemented system does not need any preprocessing and can rapidly acquire coordinate terms for any query term. it uses a conventional Web search engines 2 times where queries for the search engine are generated by connecting the user`s query term and a conjunction "OR". Also, it obtains background context between the query term and each searched coordinate term.
  • 河重 貴洋, 大島 裕明, 小山 聡, 田中 克己
    情報処理学会研究報告. データベース・システム研究会報告 2006(77, 2006-DBS-140(II)) 329-336 2006年7月  
    ある電子メールを閲覧している際に,これまでに受信したメールや,インターネット上の情報など,そのメールの中には含まれない情報がユーザに必要となることがある.これまで,そのようなユーザが必要とする情報は自分で検索する必要があった.そこで本研究では,閲覧中のメール,および,これまでに受信したメールを解析することで,閲覧メールの情報を補完する情報を持ったメールを検索・提示する手法を提案する.提案手法においては閲覧中のメールを補完するメールを抽出するために,メールデータの時間的な一区間におけるキーワードの出現数に着目し,話題となる語の特定を行う.そして,同じ話題を持つメールを解析することで,その話題語に対する詳細語の発見を行う.この詳細語に基づいて補完するメールを検索し,ユーザに補完情報の提示を行う.Reading a Email message, we need the information which is not included in the reading Email and get the information from Web pages or other Emails. In this case to get the information we must search the Web or Emails. Therefore, we propose the method of searching Emails which have the complementary information with the reading Email. To search the complementary Email we analyze the reading Email and other Emails. In our method we use the frequency in the time span to detect the keyword which is the topic keyword of the reading Email. Analyzing the Emails which have the same topic, we extract the detailing keywords of the topic keyword. Therefore we select the Emails which have the complementary information with the reading Email and show the Emails to user.
  • 大島 裕明, 小山 聡, 田中 克己
    情報処理学会研究報告 2006(77, 2006-DBS-140(II)) 153-160 2006年7月  
    本研究では,ユーザが保有している文書のいくつかをクエリとして,それらのカテゴリと兄弟カテゴリにあたるような文書を,Web 上から取得する手法について提案を行う.ある分野について網羅的に調べているときなど,自分がすでに知っている情報と関連するが少し異なるような文書,すなわち,自分が保有している文書が属するカテゴリに対して兄弟カテゴリに属するような文書を検索したい場合がある.そのような兄弟カテゴリ文書を検索するために,我々はこれまで,ユーザが持っている文書をクエリとしたときにどのような文書が兄弟カテゴリ文書として適しているかを評価する手法について研究を行ってきた.本稿では,ユーザがクエリとして与えた文書群からWeb 検索エンジンに対するクエリを作成して,Web 上にある兄弟カテゴリの文書として適する可能性がある文書を効率よく収集する手法について提案する.これまで行ってきた評価手法の研究の成果と本提案を用いることでWeb から兄弟カテゴリの文書を効率よく取得可能となる.This research proposed a method to search sibling category Web pages by a query which consists of example documents. When a user is studying about a certain field comprehensively, he or she will want documents that are related to the field but different from the documents he or she already has. Such a document is called a "sibling category page" in this paper. Our method is for acquiring sibling category pages. A user needs to submit some documents as a query. We proposed a method to evaluate how a document is relevant to a sibling category pages for a user`s query documents. We proposed a method to generate Wen search queries from user`s query documents by using a method to find coordinate terms from any term
  • 小谷 彬, 小山 聡, 大島 裕明, 田中 克己
    情報処理学会研究報告 2006(77, 2006-DBS-140(II)) 43-49 2006年7月  
    Web サイトには効率よく必要な情報を得るために,サイトマップが存在し,そのサイトの構造や内容に基づいて情報が整理され提示されている.ユーザにとっては,それが複数のWeb サイト間で同様の形式で整理されていることが望ましい.なぜなら類似したWeb サイト間において,共通の項目に関するページを比較して閲覧することは,ユーザにとって負担であり困難でもあるからである.そこで我々は複数のWeb サイト間における共通属性を抽出し,その共通属性の各属性に該当するWebページを抽出する手法を提案する.その結果,複数のWeb サイトに共通のサイトマップが生成できることになる.共通属性抽出においては,属性を一語で表すための手法について述べ,さらに属性間の階層化や類似属性の統合のために,複数の語で属性を現す属性拡張の手法についても述べる.For getting information of necessity efficiently in a Web site, a Web site has the site map which arranges inforamtions based on the structure and contents of the site. For a user, it is desirable for site maps to be arranged in a similar form between multiple Web sites. Because, it is burden for a user to compare and browse the Web pages describing common subject between multiple similar Web sites. Therefore we propose the technique extracting common attributes between multiple Web sites and finding the Web page falling under each attribute of the common attributes. As a result, we generate the common site map for multiple Web sites. In common attribute extraction, we show the technique to express an attribute by a single word and the technique of attribute expansion to show an attribute in multiple words for hierarchization between attributes and unification of a similar attribute more.
  • 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会, 第17回データ工学ワークショップ (DEWS 2006) 5A-i7 2006年3月  査読有り
  • 赤木 法生, 大島 裕明, 小山 聡, 田島 敬史, 田中 克己
    電子情報通信学会, 第17回データ工学ワークショップ (DEWS 2006) 2C-i10 2006年3月  査読有り
  • 野田 武史, 大島 裕明, 手塚 太郎, 小山 聡, 田中 克己
    電子情報通信学会, 第17回データ工学ワークショップ (DEWS 2006) 2C-i8 2006年3月  査読有り
  • 河重 貴洋, 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会, 第17回データ工学ワークショップ (DEWS 2006) 3C-i14 2006年3月  査読有り
  • 竹原 幹人, 大島 裕明, 田中 克己
    電子情報通信学会技術研究報告. DE, データ工学 105(171) 29-34 2005年7月6日  
    本論文では, Blogからニュース記事に対する意見を抽出し, Blogの書き手の興味を考慮して意見を提示するシステムの提案を行う.従来のWebではなくBlogという枠で考えることで, より最近の話題についての意見などの情報を提示することができ, また現在重要なものではなく今後重要になるかもしれない情報に着目することができるようになると思われる.Blogでは, 話題となっているニュースに対し, 書き手独自の視点に立った意見が書かれることが多い.多くのBlogからこのような意見を抽出し, 統合して提示を行う.またBlogには, 同じ書き手が書いた過去の記事が含まれる.これまでに書かれた記事から, 書き手の持つ興味を推測することが可能である.この興味を利用して意見を提示することで, ある話題に対しどのような人がどのような意見を述べているかを把握することができる.
  • 羽多野 一磨, 大島 裕明, 是津 耕司, 田中 克己
    電子情報通信学会技術研究報告. DE, データ工学 105(171) 179-184 2005年7月6日  
    近年, デジタルカメラ付き携帯電話やノートPCが普及してきており, 個人の所有するコンテンツが増加してきている.これらのコンテンツの中には他者にとって有用なコンテンツが含まれている.また, アドホックネットワークやインスタントメッセンジャーの様にユーザ同士がPeer-to-Peerに接続し, 自律分散的に形成されるネットワークが生まれてきている.そこで我々はこの様な環境においてコンテンツを共有・検索する手法について提案する.従来型のP2Pネットワークにおける検索ではファイル名とのキーワードマッチングのみであった.提案手法では, あるコンテンツの文脈情報-コンテンツの置かれている状況-を抽出・提示する事により, ユーザがコンテンツを評価できるようにしたり, 発見的に関連コンテンツを検索したり出来るようにする.
  • 羽多野 一磨, 大島 裕明, 是津 耕司, 田中 克己
    情報処理学会研究報告 2005(67, 2005-DBS-137) 229-235 2005年7月  
  • 大島 裕明, 小山 聡, 田中 克己
    情報処理学会研究報告 2005(67, 2005-DBS-137) 105-111 2005年7月  
  • 竹原 幹人, 大島 裕明, 田中 克己
    情報処理学会研究報告 2005(67, 2005-DBS-137) 39-45 2005年7月  
    本論文では,Blog からニュース記事に対する意見を抽出し,Blog の書き手の興味を考慮して意見を提示するシステムの提案を行う.従来の Web ではなくBlog という枠で考えることで,より最近の話題についての意見などの情報を提示することができ,また現在重要なものではなく今後重要になるかもしれない情報に着目することができるようになると思われる.Blog では,話題となっているニュースに対し,書き手独自の視点に立った意見が書かれることが多い.多くの Blog からこのような意見を抽出し,統合して提示を行う.また Blogには,同じ書き手が書いた過去の記事が含まれる.これまでに書かれた記事から,書き手の持つ興味を推測することが可能である.この興味を利用して意見を提示することで,ある話題に対しどのような人がどのような意見を述べているかを把握することができる.In this paper, we propose a system that extracts opinions of news from blogs and represents opinion data for considering authors' interests in blogs.For considering the frame of the blogs instead of the past web,we can follow opinions of recent topics and pay attention to information that will become important in the future.In blogs, authors often express their original opinions of topics that are talked about.Our proposal system extracts such opinions from many blogs and represents integrated opinions.The blogs also contain the archived entries that are written by the same authors.From such archived entries, we can estimate the authors' interests.Representing with Using author's interests,we can understand what kinds of people say about the topic or what opinions people express of the topic.
  • 山口 雅史, 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会, 第16回データ工学ワークショップ (DEWS 2005) 2C-i12 2005年3月  査読有り
  • 郡 宏志, 竹原 幹人, 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会, 第16回データ工学ワークショップ (DEWS 2005) 2C-i8 2005年3月  査読有り
  • 河重 貴洋, 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会, 第16回データ工学ワークショップ (DEWS 2005) 1C-i6 2005年3月  査読有り
  • 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会, 第16回データ工学ワークショップ (DEWS 2005) 6C-i6 2005年3月  査読有り
  • 大島裕明
    電子情報通信学会技術研究報告 105(171) 83-88 2005年  
  • 大島 裕明, 小山 聡, 田中 克己
    電子情報通信学会技術研究報告. DE, データ工学 104(177) 43-48 2004年7月7日  
    個人のコンピュータには,その個人がどのような知識を持っているか,どのような考え方をしているか,ということがわかる情報が含まれている.しかし,それらはコンピュータに利用できるような状態にはなっていない.現在,さまざまな分野でシソーラスのような一般的な概念体系が用いられているが,個人のコンピュータに存在するコンテンツから個人的な概念体系が作成されれば,さまざまな分野におけるパーソナライゼーションが可能になる.本稿では,個人コンピュータに存在する文書とその分類の方法から,個人的な概念体系を作成する手法について提案を行い,作成された個人的な概念体系を用いてウェブ情報検索におけるパーソナライゼーションを行う手法について提案を行う.
  • 羽多野 一磨, 大島 裕明, 是津 耕司, 田中 克己
    電子情報通信学会技術研究報告. DE, データ工学 104(176) 157-162 2004年7月6日  
    近年P2Pネットワークが注目されて久しい.P2Pネットワークはサーバクライアントモデルに比べて,情報共有が容易なモデルであると考えられる.しかしながら,そこでの情報検索は検索の高速化という側面においては研究が盛んであるものの,情報検索という面においてはファイル名とクエリとのマッチングという原始的な手法が主であり,十分とはいえなかった.このため本論文ではP2Pネットワークにおける検索についての問題点を発見し,従来より柔軟な検索手法について提案する.
  • 羽多野 一磨, 大島 裕明, 是津 耕司, 田中 克己
    情報処理学会研究報告 2004(72, 2004-DBS-134(I)) 199-205 2004年7月  
    近年P2Pネットワークが注目されて久しい.P2Pネットワークはサーバ・クライアントモデルに比べて,情報共有が容易なモデルであると考えられる.しかしながら,そこでの情報検索は検索の高速化という側面においては研究が盛んであるものの,情報検索という面においてはファイル名とクエリとのマッチングという原始的な手法が主であり,十分とはいえなかった.このため本論文ではP2Pネットワークにおける検索についての問題点を発見し,従来より柔軟な検索手法について提案する.Recently, P2P network has been drawing attention. It is easier to share information on P2P network model than on server-client model. However, almost all researches study on improvement in the speed of retrieval. On the aspect of the information retrieval, matching file name with query is major, but it is very primitive and not enough to retrieve information efficiently. So, we find the problems of information retrieval on traditional P2P network, and we propose the system which provides more flexible information retrieval than one in the past.

書籍等出版物

 4

講演・口頭発表等

 4

共同研究・競争的資金等の研究課題

 19

産業財産権

 3

学術貢献活動

 2