[1] Deep Reinforcement Learning for Dialogue Generation
Jiwei Li, Will Monroe, Alan Ritter, Michel Galley, Jianfeng Gao, Dan Jurafsky - ACL, 2016. link
REINFORCEアルゴリズムを用いてニューラル対話モデルを学習。報酬を工夫
[2] A Persona-Based Neural Conversation Model
Jiwei Li, Michel Galley, Chris Brockett, Georgios P. Spithourakis, Jianfeng Gao, Bill Dolan - ACL, 2016. link
話者の特徴ベクトルをニューラル対話モデル組み込んで、話者特有の対話文を生成する
[3] Adversarial Learning for Neural Dialogue Generation
Jiwei Li, Will Monroe, Tianlin Shi, Sébastien Jean, Alan Ritter, Dan Jurafsky - ???, 2017. link
Adversarial Trainingを用いて、人間とボットを識別するように学習して、人間の応答により近い文を生成する
[4] Reinforcement Learning for Mapping Instructions to Actions
S.R.K. Branavan, Harr Chen, Luke S. Zettlemoyer, Regina Barzilay - ACL, 2009. link
方策勾配法を用いて、説明文書からコマンド系列(行動系列)の対応関係を学習する
[5] A Diversity-Promoting Objective Function for Neural Conversation Models
Jiwei Li, Michel Galley, Chris Brockett, Jianfeng Gao, Bill Dolan - NAACL-HLT, 2016. link
Sequence to Sequenceを用いた対話応答は一般的な返答(例、I don't know)が返され易い。そこで、所与の文Sに対する次の文Tを予測したときの尤度P(T|S)を、予測した文の尤度P(T)で割り、得られた相互情報量P(T,S)/P(S)P(T)が大きくなるような文を返すようにする
[6] Dialogue Learning With Human-In-The-Loop
Jiwei Li, Alexander H. Miller, Sumit Chopra, Marc'Aurelio Ranzato, Jason Weston - ICLR, 2017. link
対話型の質問応答を強化学習で訓練する
[7] On-line Active Reward Learning for Policy Optimisation in Spoken Dialogue Systems
Pei-Hao Su, Milica Gasic, Nikola Mrksic, Lina Rojas-Barahona, Stefan Ultes, David Vandyke, Tsung-Hsien Wen, Steve Young - ACL, 2016. link
ガウス過程(分類)を用いて会話文のベクトル表現とユーザの評価から報酬信号を予測して、強化学習を用いた対話システムの方策を更新する
[8] Deep Reinforcement Learning for Dialogue Generation
Jiwei Li, Will Monroe, Alan Ritter, Michel Galley, Jianfeng Gao, Dan Jurafsky - EMNLP, 2016. link
seq2seqと強化学習を組み合わせてチャット対話の生成
[9] Stochastic Language Generation in Dialogue using Recurrent Neural Networks with Convolutional Sentence Reranking
Tsung-Hsien Wen, Milica Gasic, Dongho Kim, Nikola Mrksic, Pei-Hao Su, David Vandyke and Steve Young - SIGdial, 2015. link
RNNとCNNを使って音声対話システムの言語生成
[10] Generating Text with Deep Reinforcement Learning
Hongyu Guo - NIPS Deep Reinforcement Learning Workshop, 2015. link
Sequence-to-Sequenceのデコーディングの部分にDQNを使う
[11] Knowledge-driven activity recognition and segmentation using context connections
Georgios Meditskos, Efstratios Kontopoulos, and Ioannis Kompatsiaris - ISWC, 2014. link
時間的に重複するRDFインスタンスの数からコンテクストとその類似度を定義、日常生活行動のセグメンテーションと認識に利用
[12] Unsupervised Recognition of Interleaved Activities of Daily Living through Ontological and Probabilistic Reasoning
Daniele Riboni, Timo Sztyler, Gabriele Civitarese, and Heiner Stuckenschmidt - UbiComp, 2016. link
マルコフ論理ネットワークで日常生活行動の認識。日常生活空間の情報を記述したオントロジーからルールを作成。
[13] Query expansion with locally-trained word embeddings
Fernando Diaz, Bhaskar Mitra, Nick Craswell - ACL, 2016. link
検索要求のトピックは個々に異なるので、全体的な情報ではなく局所的な情報(初期検索の上位の結果を使う)を用いてword2vecを学習してトピックに依存したクエリ拡張手法を提案
[14] Fast and accurate sentence alignment of bilingual corpora
Robert C. Moore - AMTA, 2002. link
文の長さのモデルと単語ベースのアライメントを組み合わせた文のアライメントモデルを提案
[15] Pseudo-aligned multilingual corpora
Fernando Diaz and Donald Metzler - IJCAI, 2007. link
言語モデルの分布の類似度を手がかりにして、文書間のアライメントをする
[16] Unsupervised transcription of historical documents
Taylor Berg-Kirkpatrick, Greg Durrett, and Dan Klein - ACL, 2013. link
言語モデル・文字の位置・インクのモデルを統合した生成モデルを作成して歴史文書を解読
[17] Representing general relational knowledge in ConceptNet 5
Catherine Havasi and Robert Speer - LREC, 2012. link
ConceptNet 5の紹介.
[18] Learning structured embeddings of knowledge bases
Antoine Bordes, Jason Weston, Ronan Collobert, and Yoshua Bengio - AAAI, 2011. link
Knowlege Graphのグラフ埋め込み手法を提案.
[19] Semantic mapping with mobile robots
Andrzej Pronobis - PhD thesis, 2011. link
Semantic mapping(空間を表すコンセプトをセンシングした空間情報にマッピングすること)に関する博論.サーベイとして有効だが情報が古い
[20] Common sense data acquisition for indoor mobile robots
Rakesh Gupta and Mykel J. Kochenderfer - AAAI, 2004. link
クラウドソーシングで,文のテンプレート(e.g. A hanger is used to ___. You often want a fan to be ___ )を埋めることによって,屋内の常識的知識を取得.
[21] Predicting daily activities from egocentric images using deep learning
Daniel Castro, Steven Hickson, Vinay Bettadapura, Edison Thomaz, Gregory Abowd, Henrik Christensen, and Irfan Essa - ISWC, 2015. link
一人称視点画像を用いて行動認識
[22] Incremental graph clustering for efficient retrieval from streaming egocentric video data
Chandrasekhar, Vijay and Tan, Cheston and Min, Wu and Liyuan, Li and Xiaoli, Li and Hwee, Lim Joo - ICPR, 2014. link
一人称視点画像の検索
[23] The use of a wearable camera, sensecam, as a pictorial diary to improve autobiographical memory in a patient with limbic encephalitis: a preliminary report
Emma Berry, Narinder Kapur, Lyndsay Williams, Steve Hodges, Peter Watson, Gavin Smyth, James Srinivasan, Reg Smith, Barbara Wilson, Ken Wood - Neuropsychological Rehabilitation, 2007. link
ウェアラブルカメラを使って記憶障害のある人の記憶補助
[24] Context-based video retrieval system for the life-log
Tetsuro Hori and Kiyoharu Aizawa - MIR, 2003. link
ライフログの検索
[25] Temporal segmentation of egocentric videos
Yair Poleg, Chetan Arora, and Shmuel Peleg - CVPR, 2014. link
一人称視点映像のセグメンテーション
[26] Temporal Segmentation and Activity Classification from First-person Sensing
Ekaterina H. Spriggs, Fernando De La Torre, and Martial Hebert - IEEE Workshop on Egocentric Vision, CVPR, 2009. link
CMU-MMACデータ・セットの一人称視点映像をセグメンテーション+行動認識
[27] Fast unsupervised ego-action learning for first-person sports videos
Kris M Kitani, Takahiro Okabe, Yoichi Sato, Akihiro Sugimoto - CVPR, 2011. link
GoProで撮影したスポーツの一人称視点映像について行動認識
[28] Story-driven summarization for egocentric video
Zheng Lu and Kristen Grauman - CVPR, 2013. link
ストーリ性を考慮して一人称視点映像を要約
[29] Discovering important people and objects for egocentric video summarization
Yong Jae Lee, Joydeep Ghosh, Kristen Grauman - CVPR, 2012. link
一人称視点映像中の人・物体に注目して要約
[30] Discriminative metric learning in nearest neighbor models for image auto-annotation.
Matthieu Guillaumin, Thomas Mensink, Jakob Verbeek, Cordelia Schmid - ICCV, 2009. link
画像の言語アノテーション,k-近傍法で検索
[31] SenseCam: a retrospective memory aid
Steve Hodges, Lyndsay Williams, Emma Berry, Shahram Izadi, James Srinivasan, Alex Butler, Gavin Smyth, Narinder Kapur, Ken Wood - UbiComp, 2006. link
ウェアラブルカメラを使って記憶補助
[32] A personal digital store
Gordon Bell - Communications of the ACM, 2001. link
ライフログの話
[33] Mylifebits: a personal database for everything
Jim Gemmell, Gordon Bell - Communications of the ACM, 2006. link
ライフログの話
[34] Understanding egocentric activities
Alireza Fathi, Ali Farhadi, James M. Rehg - ICCV, 2011. link
物体と手に関する特徴から行動認識
[35] Activity recognition from user-annotated acceleration data
Ling Bao, Stephen S. Intille - Pervasive, 2004. link
加速度センサを用いて行動認識.被験者20人でleave-one-subjectの交差検定の結果,20個の日常生活動作を84%のaccuracyで分類
[36] A Probabilistic Interpretation of Canonical Correlation Analysis
Francis R. Bach, Michael I. Jordan - Technical Report, 2005. link
確率的正準相関分析
[37] Canonical correlation analysis: an overview with applica- tion to learning method
David R. Hardoon, Sandor Szedmak, John Shawe-Taylor - Technical Report, 2004. link
正準相関分析
[38] Bayesian Surprise Attracts Human Attention
Laurent Itti, Pierre Baldi - NIPS, 2006. link
驚きの定量化ではなく,驚きを定量化.
[39] First-person activity recognition: what are they doing to me?
M. S. Ryoo, Larry Matthies - CVPR, 2013. link
固定カメラの一人称視点映像から,カメラ装着者になされた行動を認識
[40] Document expansion for speech retrieval
Amit Singhal, Fernando Pereira - SIGIR, 1999. link
文書拡張?
[41] Language Model Information Retrieval with Document Expansion
Tao Tao, Xuanhui Wang, Qiaozhu Mei, ChengXiang Zhai - ACL, 2006. link
ある文書と類似した文書を見つけて(文書拡張),その文書中合中に出現する単語を用いて言語モデルに基づく検索モデルを平滑化
[42] Multimedia Search Reranking: A Literature Survey
Tao Mei, Yong Rui, Shipeng Li, Qi Tian - ACM Computing Surveys, 2014. link
マルチメディア検索の再順位付け手法のサーベイ
[43] Language to Code: Learning Semantic Parsers for If-This-Then-That Recipes
Chris Quirk, Raymond Mooney, Michel Galley - ACL, 2015. link
IFTTTのコマンドをその説明文から生成する.複数のコマンドを抽象木に分解,説明文のn-gramを特徴として,コマンド(抽象木のノード)をロジスティック回帰で予測,出力の積を説明文からコマンドが生成される確率とする.
[44] Every Picture Tells a Story: Generating Sentences from Images
Ali Farhadi, Mohsen Hejrati, Mohammad Amin Sadeghi, Peter Young, Cyrus Rashtchian, Julia Hockenmaier, David Forsyth - ECCV, 2010. link
画像からその説明文(物体,行動,背景の組み合わせ)を構造学習で予測
[45] Corpus-Guided Sentence Generation of Natural Images
Yezhou Yang, Ching Lik Teo, Hal Daume III, Yiannis Aloimonos - EMNLP, 2011. link
画像コーパスから物体と背景を表す単語の出現確率,説明文で主語と目的語の名詞と同時に現れる動詞の出現確率,動詞・名詞と同時に現れる背景を表す名詞の出現確率を組み合わせてビタビで画像を説明する文を生成.
[46] Grounding Action Descriptions in Videos
Michaela Regneri, Marcus Rohrbach, Dominikus Wetzel, Stefan Thater, Bernt Schiele, Manfred Pinkal - TACL, 2013. link
記号接地のためのコーパスを作成.クラウドソーシングでキッチンでの行動を記述する文を動画に付与.
[47] Jointly Learning to Parse and Perceive: Connecting Natural Language to the Physical World
Jayant Krishnamurthy, Thomas Kollar - TACL, 2013. link
文中に登場する物体のカテゴリや空間的な関係を論理形式に変換.論理形式の重みを弱教師付きで学習.
[48] Translating Video Content to Natural Language Descriptions
Marcus Rohrbach, Wei Qiu, Ivan Titov, Stefan Thater, Manfred Pinkal, Bernt Schiele - ICCV, 2013. link
画像中の意味表現をCRFで予測,意味表現に対応する言語生成を翻訳問題として考え,Mosesを使う.
[49] Learning to Connect Language and Perception
Raymond J. Mooney - AAAI, 2008. link
自然言語を意味表現に対応付ける研究のサーベイ(主にMooneyのチーム).やや古い.
[50] Learning to Sportscast: A Test of Grounded Language Acquisition
David L. Chen, Raymond J. Mooney - ICML, 2008. link
ロボカップサッカーの解説(自然言語)をロボットのコマンドに対応付ける.
[51] Environment-Driven Lexicon Induction for High-Level Instructions
Dipendra K. Misra, Kejia Tao, Percy Liang, Ashutosh Saxena - ACL, 2015. link
自然言語による指示を実環境で動くロボットのコマンドに変換.
[52] Discriminative Unsupervised Alignment of Natural Language Instructions with Corresponding Video Segments
Iftekhar Naim, Young Chol Song, Qiguang Liu, Liang Huang, Henry Kautz, Jiebo Luo, Daniel Gildea - NAACL-HLT, 2015. link
識別モデル(潜在CRF,潜在構造化パーセプトロン,潜在構造化SVM)を使って映像中の物体+動作と文書中の名詞をアライメント.
[53] Unsupervised Alignment of Natural Language Instructions with Video Segments
Iftekhar Naim, Young Chol Song, Qiguang Liu, Henry Kautz, Jiebo Luo, Daniel Gildea - AAAI, 2014. link
生物実験を撮影した映像に映る物体とその実験を説明する文書中の名詞を隠マルコフモデルとIBM1の組み合わせでアライメント.
[54] Learning Semantic Correspondences with Less Supervision
Percy Liang, Michael I. Jordan, Dan Klein - ACL, 2009. link
セミ隠れマルコフモデルを用いて,テキストをレコード中のフィールドに対応付け,レコードごとに分割する生成モデルを提案.
[55] From Captions to Visual Concepts and Back
Hao Fang, Saurabh Gupta, Forrest Iandola, Rupesh Srivastava, Li Deng, Piotr Dollár, Jianfeng Gao, Xiaodong He, Margaret Mitchell, John C. Platt, C. Lawrence Zitnick, Geoffrey Zweig - CVPR, 2015. link
畳み込みニューラルネットを使って画像中の物体に対応する単語を生成,最大エントロピー言語モデルで単語を並び替えて文を生成,MERTを使って生成した文を再順位付け.
[56] Trainable Methods for Surface Natural Language Generation
Adwait Ratnaparkhi - NAACL-HLT, 2000. link
アノテーション(意味属性や統語的依存関係など)したコーパスを用いて言語生成.
[57] The Lumiere Project: Bayesian User Modeling for Inferring the Goals and Needs of Software Users
Eric Horvitz, Jack Breese, David Heckerman, David Hovel, Koos Rommelse - UAI, 1998. link
ベイジアンネットワークを使ってユーザの行動をモデリング,Officeのユーザ支援に利用.
[58] A study of factors affecting the utility of implicit relevance feedback
Ryen W. White, Ian Ruthven, Joemon M. Jose. - SIGIR, 2005. link
明示的・暗黙的フィードバックの効果は,検索課題の難しさや経過時間,ユーザの経験に影響を受ける.
[59] A simulated study of implicit feedback models
Ryen W. White, Ian Ruthven, Joemon M. Jose, C. J. Van Rijsbergen - ECIR, 2004. link
暗黙的フィードバックをシミュレーションで評価
[60] Interactive disaster information search system for microblog by minimal user feedback
Sayaka Kitaguchi, Taiki Miyanishi, Kazuhiro Seki, Kuniaki Uehara - AIRS, 2013. link
震災時の大量のtweetの中から有用なtweetを検索する方法についてユーザ実験で検証.
[61] Global statistics in proximity weighting models
Craig Macdonald, Iadh Ounis - SIGIR Web N-gram Workshop, 2010. link
コーパス中の近接する単語ペアの頻度は検索性能にあまり影響しない.
[62] Retrieval evaluation with incomplete information
Chris Buckley, Ellen M. Voorhees - SIGIR, 2004. link
適合文書のデータセットが不完全な場合でもMAPやPrecisionよりも頑健に評価が行える指標bpref(binary preference)を提案.
[63] Graph-of-word and TW-IDF: new approach to ad hoc IR
François Roussea ad, Michalis Vazirgianni - CIKM, 2013. link
文書中の語の順序有りの共起関係から,語をノード,共起関係をエッジとする重み無しの有向グラフを作成.グラフ中の語の入次数(TW)と逆文書頻度(IDF)を掛け合わせた語の重み付けTW-IDFを提案.
[64] Learning deep structured semantic models for web search using clickthrough data
Po-Sen Huang, Xiaodong He, Jianfeng Gao, Li Deng, Alex Acero, Larry Heck - CIKM (short), 2013. link
ディープニューラルネットワーク(DNN)を用いて単語列を低次元のベクトルで表現,この低次元空間におけるクエリと文書のコサイン類似度で文書をランキング.DNNのパラメータの最適化に検索クリックスルーログを使用.
[65] On sparsity and drift for effective real-time filtering in microblogs
M-Dyaa Albakour, Craig Macdonald, Iadh Ounis - CIKM, 2013. link
マイクログログに対する情報フィルタリングをIncremental Rocchioアルゴリズムの改良版で行う.文書の短さをクエリ拡張,トピックドリフトを...で対処.
[66] Linguistic regularities in continuous space word representations
Tomas Mikolov, Wen-tau Yih, Geoffrey Zweig - NAACL-HLT, 2013. link
Recurrent Neural Network を用いて単語を特徴ベクトルで表現.2つの単語を表すベクトルの差分が両者の意味的な関係を表す.
[67] Dependence language model for information retrieval
Jianfeng Gao, Jian-Yun Nie, Guangyuan Wu, Guihong Cao - SIGIR, 2004. link
単語間の依存関係を考慮した言語モデルに基づく情報検索の枠組み.単語間の依存関係の候補は構文解析から取得.
[68] Temporal feedback for tweet search with non-parametric density estimation
Miles Efron, Jimmy Lin, Jiyin He, Arjen de Vries - SIGIR, 2014. link
``temporal cluster hypothesis"の論文.特定の時間に適合文書が密集するため,時間は適合度にとって重要な役割を果たす.Twitter検索で検証.
[69] Temporal relevance profiles for tweet search
Jimmy Lin, Miles Efron - TAIA, 2013. link
Time-aware IRではトピックに関する時間情報の推定が重要!だけど自動で推定するのは難しいからユーザとのインタラクションを取り入れて推定してみてはどう?
[70] #TwitterSearch: a comparison of microblog search and web search
Jaime Teevan, Daniel Ramage, Merredith Ringel Morris - WSDM, 2011. link
クエリログの解析を行いWeb検索とTwitter検索の違いについて調べた.
[71] Improving pseudo-relevance feedback via tweet selection
Taiki Miyanishi, Kazuhiro Seki, Kuniaki Uehara - CIKM, 2013. link
初期クエリとその適合tweet1つを組み合わせたクエリを作成.この疑似クエリで検索した結果に疑似適合フィードバックを適用すると頑健なTwitter検索ができる.
[72] Corpus structure, language models, and ad hoc information retrieval
Oren Kurland, Lillian Lee - SIGIR, 2004. link
k近傍法で文書のクラスタリング,取得したクラスタ情報を用いて文書の順位付け.
[73] Cluster-based retrieval using language models
Xiaoyong Liu, W. Bruce Croft - SIGIR, 2004. link
k平均法を用いて類似する文書をクラスタリング,クラスタの情報を用いて言語モデルに基づく検索手法の平滑化.
[74] LDA-based document models for ad-hoc retrieval
Xing Wei, W. Bruce Croft - SIGIR, 2006. link
潜在的ディリクレ配分法(Latent Dirichlet Allocation, LDA)を用いてクラスタ情報を取得,言語モデルの平滑化に利用.
[75] Cluster-based query expansion
Inna Gelfer Kalmanovich, Oren Kurland - SIGIR (poster), 2009. link
クエリ拡張にクラスタの情報を利用.
[76] Language model information retrieval with document expansion
Tao Tao, Xuanhui Wang, Qiaozhu Mei, ChengXiang Zhai - HLT-NAACL, 2006. link
k近傍法で類似文書を集めて言語モデルの平滑化.
[77] Improving retrieval of short texts through document expansion
Miles Efron, Peter Organisciak, Katrina Fenlon - SGIR, 2012. link
短い文書は1つのトピックに対して言及していると考え,文書を疑似クエリとみなして検索.検索結果の語彙・時間情報を検索モデルに利用.
[78] Indri: a language model-based search engine for complex queries
Trevor Strohman, Donald Metzler, Howard Turtle, W. Bruce Croft - ICIA, 2004. link
Indri検索エンジンについて
[79] Building an entity-centric stream filtering test collection for TREC 2012
John R. Frank, Max Kleiman-Weiner, Daniel A. Roberts, Feng Niu, Ce Zhang, Christopher Ré, Ian Soboroff - TREC, 2012. link
TREC 2012 Knowledge Base Acceleration (KBA) track の概説
[80] Modeling higher-order term dependencies in information retrieval using query hypergraphs
Michael Bendersky, W. Bruce Croft - SIGIR, 2012. link
ハイパーグラフを用いてコンセプト(複数の単語の組み合わせ)の組み合わせを表現.例えば,(dog, law, enforcement) だけでなく,(dog, "law enforcement") も扱うことができる.
[81] Effective query formulation with multiple information sources
Michael Bendersky, Donald Metzler, W. Bruce Croft - WSDM, 2012. link
検索対象以外の外部ソース(例:ClueWeb,Wikipediaなど)から疑似適合フィードバックを通してコンセプト(複数の単語の組み合わせ)を取得,クエリの再構築に使用.
[82] Parameterized concept weighting in verbose queries
Michael Bendersky, Donald Metzler, W. Bruce Croft - SIGIR, 2011. link
冗長なクエリに関連するコンセプト(複数の単語の組み合わせ)の重みを教師あり学習(外部ソース + 潜在コンセプト)で推定,クエリ拡張に使用.
[83] Learning concept importance using a weighted dependence model
Michael Bendersky, Donald Metzler, W. Bruce Croft - WSDM, 2010. link
既存のマルコフ確率場を用いた単語間の依存関係の表現では,コンセプトの重みが同じになってしまう.そこで,コンセプトの重みを内部・外部ソースのunigramやbigramなどの重み付き線形和で表し,順位学習でその重みを推定する.
[84] Discovering key concepts in verbose queries
Michael Bendersky, W. Bruce Croft - SIGIR, 2008. link
既存の検索エンジンは冗長なクエリ(Verbose Query)が苦手.そこで,冗長なクエリの中からキーフレーズを抽出,クエリ中のキーフレーズを教師あり学習で重み付け.
[85] Latent concept expansion using markov random fields
Donald Metzler, W. Bruce Croft - SIGIR, 2007. link
マルコフ確率場を用いて単語間の依存関係を表現.複数の単語の組み合わせをコンセプトとし,疑似適合フィードバックを用いてコンセプトを抽出,クエリ拡張に利用.
[86] A Markov random field model for term dependencies
Donald Metzler, W. Bruce Croft - SIGIR, 2005. link
マルコフ確率場を用いて単語間の依存関係を表現.クエリ中の連接する単語の組み合わせ,もしくは,近接する単語の組み合わせ考慮してクエリを再構築.
[87] Incorporating query expansion and quality indicators in searching microblog posts
Kamran Massoudi, Manos Tsagkias, Maarten de Rijke, Wouter Weerkamp - ECIR, 2011. link
単語の新近性と特定性を考慮してTwitterのクエリ拡張に利用.
[88] Exploiting real-time information retrieval in the microblogosphere
Feng Liang, Runwei Qiang, Jianwu Yang - JCDL, 2012. link
クエリ拡張で検索した後,文書のタイムスタンプをもとに文書の再順位付け.
[89] Combining recency and topic-dependent temporal variation for microblog search
Taiki Miyanishi, Kazuhiro Seki, Kuniaki Uehara - ECIR, 2013. link
クエリ毎の時間的性質を考慮してTwitterのクエリ拡張を行う.
[90] TREC 2012 microblog track experiments at Kobe University
Taiki Miyanishi, Kazuhiro Seki, Kuniaki Uehara - TREC, 2012. link
適合文書の1つを元のクエリに加えて検索.
[91] Time-sensitive query auto-completion
Milad Shokouhi, Kira Radinsky - SIGIR, 2012. link
時系列解析を用いてクエリの使用頻度を予測,クエリ自動補完に利用.
[92] Time-aware structured query suggestion
Taiki Miyanishi, Tetsuya Sakai - SIGIR (short), 2013. link
ユーザによって,いつの時間の情報を知りたいかは異なる.そこで,与えられたクエリに関連するクエリ候補を主要な時間ごとに分けて提示.
[93] Time is of the essence: improving recency ranking using Twitter data
Anlei Dong, Ruiqiang Zhang, Pranam Kolari, Jing Bai, Fernando Diaz, Yi Chang, Zhaohui Zheng - WWW, 2010. link
Tweetは未だクロールされていない文書のURLを含む傾向にある.そこでTweetを用いて新鮮な情報を掲載するURLのランキングを行う.クエリとTweetの一致度とTweetを発したユーザーのAuthorityが重要.
[94] Hashtag retrieval in a microblogging environment
Miles Efron - SIGIR (poster), 2010. link
言語モデルに基づくハッシュタグの検索手法を提案.
[95] The University of Illinois' graduate school of library and information science at TREC 2011
Miles Efron, Adam Kehoe, Peter Organisciak, Sunah Suh - TREC, 2011. link
所与のクエリで検索したTweetのタイムスタンプの分布は,適合Tweetを疑似クエリとして検索したTweetのタイムスタンプの分布と類似.
[96] Structured event retrieval over microblog archives
Donald Metzler, Congxing Cai, Eduard Hovy - HLT-NAACL, 2012. link
過去のイベント情報に関する要約をマイクロブログデータから作成.所与のトピックに関係する時間情報(バースト)を用いてクエリ拡張を行い,そのスコアをもとにマイクロブログ文書を要約する.
[97] Temporal profiles of queries
Rosie Jones, Fernando Diaz - TOIS, 2007. link
所与のクエリに対する検索結果の文書のタイムスタンプを抽出,クエリの Temporal Profile とする.
[98] Understanding temporal query dynamics
Anagha Kulkarni, Jaime Teevan, Krysta M. Svore, Susan T. Dumais - WSDM, 2011. link
クエリログをもとにクエリの頻度を時系列で表現,各クエリの特徴ごとに時系列パターンが異なる.例えば,テレビ番組を表すクエリの使用頻度は周期的性を持つ.
[99] Time-Based Language Models
Xiaoyan Li, W. Bruce Croft - CIKM, 2003. link
時間を考慮した言語モデルに基づく情報検索.新しい文書ほど生起確率が高くなる.
[100] Relevance-based language models
Victor Lavrenko, W. Bruce Croft - SIGIR, 2001. link
言語モデルに基づく疑似適合フィードバック.
[101] A language modeling approach to information retrieval
Jay M. Ponte, W. Bruce Croft - SIGIR, 1998. link
言語モデルに基づく情報検索
[102] Time-based relevance models
Mostafa Keikha, Shima Gerani, Fabio Crestani - SIGIR (poster), 2011. link
時間を考慮した疑似適合フィードバックモデル.ブログスフェアにおいて,ある時間に特定の単語が使用されやすくなる性質を利用.
[103] A study of smoothing methods for language models applied to information retrieval
Chengxiang Zhai, John Lafferty - TOIS, 2004. link
言語モデルを用いた情報検索おいて,複数のスムージング方法(Jelinek-Mercer, Dirichlet, Absolute, discount)を比較.
[104] A word at a time: computing word relatedness using temporal semantic analysis
Kira Radinsky, Eugene Agichtein, Evgeniy Gabrilovich, Shaul Markovitch - WWW, 2011. link
単語頻度の時系列を利用してコンセプト間の類似度を測る.コンセプトの時系列を単語頻度の時系列の重み付き和で表す.
[105] Dynamic relationship and event discovery
Anish Das Sarma, Alpa Jain, Cong Yu - WSDM, 2011. link
同じ期間に言及されるエンティティ間には関連があるとみなし,エンティティ間の関係を重み付きグラフで表現.部分グラフクラスタリングを用いてイベント発見.
[106] Determining the user intent of web search engine queries
Bernard J. Jansen, Danielle L. Booth, Amanda Spink - WWW (poster), 2007. link
検索クエリを検索意図(Navigational, Transactional, Informational)ごとに自動で分類.
[107] On relevance, time and query expansion
Giuseppe Amodeo, Giambattista Amati, Giorgio Gambosi - CIKM (short), 2011. link
初期検索で検索した文書のタイムスタンプの頻度の時系列を見て,ピーク付近にある文書が含む単語に大きい重みを与えるロッキオアルゴリズムを提案.
[108] Relevance score normalization for metasearch
Mark Montague, Javed A. Aslam - CIKM, 2001. link
検索モデルの結果を統合する際の各モデルの検索スコアの正規化方法と検索統合モデルの関係について調査.
[109] Passage retrieval for incorporating global evidence in sequence labeling
Jeffrey Dalton, James Allan, David A. Smith - CIKM, 2011. link
???
[110] Diversifying search results
Rakesh Agrawal, Sreenivas Gollapudi, Alan Halverson, Samuel Ieong - WSDM, 2009. link
検索結果の多様性をクエリと各カテゴリに関連する文書が検索結果の中に少なくとも一つあることだと考える.これを劣モジュラの最大化問題として,貪欲法で解く.
[111] The use of MMR, diversity-based reranking for reordering documents and producing summaries
Jaime Carbonell, Jade Goldstein - SIGIR, 1998. link
クエリと文書の関連度(類似度)から既に選択された文書との類似度を引いた関数で最も高い値をとることで結果の多様化.
[112] Faceted metadata for image search and browsing
Ka-Ping Yee, Kirsten Swearingen, Kevin Li, Marti Hearst - CHI, 2003. link
画像のメタデータを自動で構築,Faceted Searchに使用.他の画像検索エンジンと比べてユーザビリティが向上したかを調査.美術品に関する画像を使用.
[113] Human wayfinding in information networks
Robert West, Jure Leskovec - WWW, 2012. link
Wikipedia上で,1つのコンセプトからリンクをたどることで、もうひとつのコンセプトにたどり着くゲームを行う.コンセプト間のパスを収集・解析,人がどように情報をみつけていくかをモデル化?
[114] What queries are likely to recur in web search?
Dell Zhang, Jinsong Lu - SIGIR, 2009. link
クエリの使用頻度は他のユーザが使うクエリの予測に役立つ.個人が最近使ったクエリは,その人が将来的に使うクエリの予測に役立つ.
[115] Clustering and exploring search results using timeline constructions
Omar Alonso, Michael Gertz, Ricardo Baeza-Yates - CIKM, 2009. link
タイムスタンプや文書中にある時間表現をもとに年月日毎の粒度でクラスタリング,文書を各時間毎に整理して検索できるようにした.
[116] Visual query suggestion
Zheng-Jun Zha, Linjun Yang, Tao Mei, Meng Wang, Zengfu Wang - MM, 2009. link
画像検索のクエリ推薦の際,クエリの関連語と共に画像も提示.例えば,“apple”というクエリに対して,“apple computer”とその画像,“fruit”の画像を提示.
[117] Making mind and machine meet: a study of combining cognitive and algorithmic relevance feedback
Chirag Shah, Diane Kelly, and Xin Fu - SIGIR (poster), 2007. link
疑似適合フィードバックで取得した単語と人手で判定したクエリに関連する単語をORでクエリ拡張すると良い.
[118] 'Natural' search user interfaces
Marti A. Hearst - CACM, 2011. link
検索のユーザインターフェースに関する技術・研究についての報告.音声検索,Q&A,social search,口語検索など.
[119] Algorithmic mediation for collaborative exploratory search
Jeremy Pickensy, Gene Golovchinskyy, Chirag Shahz, Pernilla Qvarfordty, Maribeth Backy - SIGIR, 2008. link
複数のユーザの検索結果を強調?
[120] Exploring the use of labels to shortcut search trails
Ryen W. White, Raman Chandrasekar - SIGIR (poster), 2011. link
あるURLにたどり着くため,クエリを何回か変更する必要がある.この変更を最小限にするために有効な素性を調査.アンカーテキストが有効らしい.
[121] Exploratory search and HCI: designing and evaluating interfaces to support exploratory search interaction
Ryen W. White, Steven M. Drucker, Gary Marchionini, Marti Hearst, m. c. schraefel - CHI EA, 2007. link
探索型検索の紹介.検索を通して人とコンピューターが相互的にかかわり合う事で,曖昧な要求+目的を明確にしていき問題を解決する.
[122] Session-based search with Querium
Gene Golovchinsky, Abdigani Diriye - HCIR, 2011. link
マルチセッションに対応した検索インターフェース.探索的な検索を支援.
[123] Making sense of Twitter search
Gene Golovchinsky, Miles Efron - CHI MW, 2010. link
Twitterの検索結果にユーザー,ハッシュタグ,リツイートなどのメタデータを同時に表示.
[124] Topical keyphrase extraction from Twitter
Wayne Xin Zhao, Jing Jiang, Jing He, Yang Song, Palakorn Achananuparp, Ee-Peng Lim, Xiaoming Li - HLT, 2011. link
Tweetからキーフレーズを抽出する方法を提案.Topical PageRank + TextRank + LDA.
[125] Distilling massive amounts of data into simple visualizations: Twitter case studies
Miguel Rios, Jimmy Lin - ICWSM (short), 2012. link
Twitterデータの可視化.
[126] A study of "churn" in tweets and real-time search queries
Jimmy Lin, Gilad Mishne - ICWSM (short), 2012. link
時間の経過とともに変化するTwitterデータの分析.
[127] Automatic generation of personalized annotation tags for Twitter users
Wei Wu, Bin Zhang, Mari Ostendorf - HLT, 2010. link
Twitterのユーザの興味を表すタグを自動的に抽出.ユーザのTweetから形容詞および名詞に相当する単語のtf–idfまたはTextRankによるスコアを求めて上位をユーザのタグと見なす.
[128] Adding semantics to microblog posts
Edgar Meij, Wouter Weerkamp, Maarten de Rijke - WSDM, 2012. link
TweetにWikipediaのコンセプトを自動付与.
[129] New-web search with microblog annotations
Tom Rowlands, David Hawking, Ramesh Sankaranarayana - WWW (demo), 2010. link
新しいWebページは他のページからのリンクが少ないのでクローリングされにくい。そこで、Tweetに含まれるURLとそのリンク先の関係を利用.
[130] Tokenizing micro-blogging messages using a text classification
Gustavo Laboreiro, Luís Sarmento, Jorge Teixeira, Eugénio Oliveira - AND, 2010. link
Tweetの字句解析.アルファベットや大文字・小文字,記号,句読点などの字面の特徴として用いる.SVMで単語の境界の有無を分類して単語分割.
[131] Personalized query expansion for the web
Paul - Alexandru Chirita, Claudiu S. Firan, Wolfgang Nejdl - SIGIR, 2007. link
クエリの明解さを個人情報から推定し,クエリ拡張で加える単語数を決定.
[132] Pseudo test collections for learning web search ranking functions
Nima Asadi, Donald Metzler, Tamer Elsayed, Jimmy Lin - SIGIR, 2011. link
検索のテストコレクションを自動的に作成.アンカーテキストを疑似クエリ,その先を適語文書と見なす.
[133] Modeling anchor text and classifying queries to enhance web document retrieval
Atsushi Fujii - WWW, 2008. link
クエリが調査型であるか誘導型であるかを判定.本文を用いた調査型検索とアンカーテキストを用いた誘導型検索とを組み合わせる.
[134] Relevant query feedback in statistical language modeling
Ramesh Nallapati, Bruce Croft, James Allan - CIKM (short), 2003. link
アンカーテキストをクエリ,アンカーテキスト先のWebページを適合文書と見なして,言語モデルに基づく適合フィードバックを作成.
[135] Analysis of anchor text for web search
Nadav Eiron, Kevin S. McCurley - SIGIR, 2013. link
Web検索においてアンカーテキストはどのような時に有効か,またその理由を調査.文書のタイトルとアンカーテキストを比較.アンカーテキストがクエリと単語数の分布で類似,タイトルよりも語彙が豊富.
[136] Mining anchor text for query refinement
Reiner Kraft, Jason Zien - WWW, 2004. link
アンカーテキストはリンク先のページの短い詳述となっているためWeb検索に使うクエリと類似している.
[137] The paraphrase search assistant: terminological feedback for iterative information seeking
Peter G. Anick, Suresh Tipirneni - SIGIR, 1999. link
{?形容詞 名詞+}で抽出した2〜4個の単語から語彙分散(共起する種類数)を計算。語彙分散の高い単語は重要
[138] Interface issues and interaction strategies for information retrieval systems
Scott Henninger, Nick Belkin - CHI, 1994. link
検索インターフェースの重要な要素として,クエリの発行の仕方,ブラウジングの仕方,検索結果をどのようにフィードバックをするかなど.
[139] Query reformulation using anchor text
Van Dang, Bruce W. Croft - WSDM, 2010. link
クエリログの代わりにアンカーテキストを使ってクエリの置き換えモデルを作成.
[140] Synthesizing high utility suggestions for rare web search queries
Alpa Jain, Umut Ozertem, Emre Velipasaoglu - SIGIR, 2011. link
クエリログやWeb文書の統計情報を素性として Gradient boosting regression tree でクエリ拡張の候補を順位付け.
[141] Measuring semantic similarity between words using web search engines
Danushka Bollegala, Yutaka Matsuo, Mitsuru Ishizuka - WWW, 2007. link
Web検索の結果を元に単語間の意味的な類似度を測る方法を提案.Web検索によって得られたページ数やスニペットを使用して,2単語間の共起指標や類似性を示す構文パターンを抽出.SVMで特徴を組み合わせる.
[142] Semantic similarity between search engine queries using temporal correlation
Steve Chien, Nicole Immorlica - WWW, 2005. link
クエリの日ごとの頻度の相関をみて関連のあるクエリを見つける.
[143] The Google similarity distance
Rudi L. Cilibrasi, Paul M.B. Vit´anyi - TKDE, 2007. link
Distanceのコルモゴロフ複雑性の部分をGoogle検索のヒット数で近似,単語の意味的な近さとする.0〜無限の値をとる.データの大きさに不変らしい.