酒井 浩之, 増山 繁
電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション 102(200) 81-86 2002年7月9日
文内要約の一要素技術として,省略可能な多重(連用・連体)修飾表現を,教師なしで自動的に獲得する手法を提案する.具体的には,(連用・連体)修飾表現と修飾先の名詞や動詞との結合度を相互情報量を元にした計算式で重みとして計算する.そして,複数の修飾表現の重みの相対的な差で省略可能な修飾表現を認定する.すなわち,重みが最も大きい修飾表現を省略不可とし,それ以外の修飾表現は最も重みの大きい修飾表現との重みの差が大きいとき省略可能と認定する.評価実験によって,本手法による省略可能な多重連体修飾表現は,精度73.4%,再現率45.7%,多重連用修飾表現は,精度74.7%,再現率42.9%であり,比較的,良好な精度を示した.