文本數據挖掘(第2版)

文本數據挖掘(第2版)
分享
掃描下方二維碼分享到微信
打開(kāi)微信,點(diǎn)擊右上角”+“,
使用”掃一掃“即可將網(wǎng)頁(yè)分享到朋友圈。
作者: , ,
2022-11
版次: 2
ISBN: 9787302612957
定價(jià): 99.00
裝幀: 其他
開(kāi)本: 16開(kāi)
紙張: 膠版紙
4人買(mǎi)過(guò)
  • 文本數據挖掘是通過(guò)機器學(xué)習、自然語(yǔ)言處理和推理等相關(guān)技術(shù)或方法,理解、分析和挖掘文本的內 容,從而完成信息抽取、關(guān)系發(fā)現、熱點(diǎn)預測、文本分類(lèi)和自動(dòng)摘要等具體任務(wù)的信息處理技術(shù)?!段谋緮祿诰颍ǖ?版)》主 要介紹與文本數據挖掘有關(guān)的基本概念、理論模型和實(shí)現算法,包括數據預處理、文本表示、文本分類(lèi)、文本聚類(lèi)、主題模型、情感分析與觀(guān)點(diǎn)挖掘、話(huà)題檢測與跟蹤、信息抽取以及文本自動(dòng)摘要等,最后通過(guò) 具體實(shí)例展示相關(guān)技術(shù)在實(shí)際應用中的使用方法?!段谋緮祿诰颍ǖ?版)》書(shū)可作為高等院校計算機、自動(dòng)化、網(wǎng)絡(luò )安全、大數據分析等專(zhuān)業(yè),以及利用到文本信息處理的交 叉學(xué)科(如金融財經(jīng)、社會(huì )人文、生物醫藥等)的高年級本科生或研究生從事相關(guān)研究的入門(mén)參考書(shū),也可供相關(guān)技術(shù)研發(fā)人員閱讀和參考。 宗成慶,中國科學(xué)院自動(dòng)化所研究員、博士生導師,中國科學(xué)院大學(xué)崗位教授,ACL/CAAI/CCF Fellow,主要從事自然語(yǔ)言處理、機器翻譯和語(yǔ)言認知計算等研究,主持國家項目10余項,發(fā)表論文200余篇,出版《統計自然語(yǔ)言處理》、《文本數據挖掘》和Text Data Mining三部專(zhuān)著(zhù)及兩部譯著(zhù)。擔任國際計算語(yǔ)言學(xué)委員會(huì )(ICCL)委員,中國中文信息學(xué)會(huì )副理事長(cháng),曾任亞洲自然語(yǔ)言處理學(xué)會(huì )(AFNLP)主席,國際一流學(xué)術(shù)會(huì )議ACL’2015和COLING’2020程序委員會(huì )主席、ACL’2021大會(huì )主席。榮獲國家科技進(jìn)步獎二等獎和多個(gè)省部級及國家一級學(xué)會(huì )的科技獎勵,獲得北京市優(yōu)秀教師、中科院優(yōu)秀導師和國科大李佩教學(xué)名師等若干榮譽(yù)。享受?chē)鴦?wù)院特殊津貼。張家俊,中國科學(xué)院自動(dòng)化研究所研究員、中國科學(xué)院大學(xué)崗位教授、博士生導師,主要研究方向為機器翻譯和自然語(yǔ)言處理,獲得國家優(yōu)秀青年科學(xué)基金資助,入選中國科協(xié)首屆青年人才托舉工程、中國科學(xué)院青年創(chuàng )新促進(jìn)會(huì )優(yōu)秀會(huì )員和北京智源青年科學(xué)家。發(fā)表CCF-A/B類(lèi)論文80余篇,出版學(xué)術(shù)專(zhuān)著(zhù)2部,譯著(zhù)1部。獲得中國中文信息學(xué)會(huì )錢(qián)偉長(cháng)中文信息處理科學(xué)技術(shù)獎一等獎、青年創(chuàng )新獎一等獎和2020年北京市科學(xué)技術(shù)獎一等獎等。擔任中國中文信息學(xué)會(huì )青年工作委員會(huì )主任和機器翻譯專(zhuān)委會(huì )副主任。擔任ACL/EMNLP/COLING的(資深)領(lǐng)域主席和《自動(dòng)化學(xué)報》等期刊的編委。夏睿,南京理工大學(xué)計算機學(xué)院教授、博士生導師,研究領(lǐng)域為人工智能、自然語(yǔ)言處理、文本數據挖掘,在國內外重要期刊和會(huì )議發(fā)表論文60余篇,出版學(xué)術(shù)專(zhuān)著(zhù)2部,主持國家和省部級項目近10項,獲得國際計算語(yǔ)言學(xué)會(huì )年會(huì )ACL2019杰出論文獎、中國中文信息學(xué)會(huì )青年創(chuàng )新獎一等獎等榮譽(yù),獲得江蘇省杰出青年基金資助。 第 1章緒論 1?

    11基本概念 1?

    12文本挖掘任務(wù) 2?

    13文本挖掘面臨的困難 5?

    14方法概述與本書(shū)的內容組織 8?

    15進(jìn)一步閱讀 ?10

    習題 ?11

    第 2章數據預處理和標注 ?12?

    21概述 ?12?

    22數據獲取 ?12?

    23數據預處理 ?16?

    24數據標注 ?18?

    25基本工具 ?20?

    251漢語(yǔ)自動(dòng)分詞與詞性標注 ?20?

    252句法分析 ?22?

    253 n元語(yǔ)法模型 ?23?

    26進(jìn)一步閱讀 ?24

    習題 ?24

    第 3章文本表示 ?25?

    31概述 ?25?

    32向量空間模型 ?25?

    321向量空間模型的基本概念 ?25?

    322特征項的構造與權重 ?26?

    323文本長(cháng)度規范化 ?27?

    324特征工程 ?28?

    325其他文本表示方法 ?30?

    33詞的分布式表示 ?31?

    文本數據挖掘 (第 2版)?

    331神經(jīng)網(wǎng)絡(luò )語(yǔ)言模型 ?32?

    332 C&W模型 ?36?

    333 CBOW與 Skip-gram模型 ?38?

    334噪聲對比估計與負采樣 ?39?

    335字詞混合的分布式表示方法 ?41?

    34短語(yǔ)的分布式表示 ?43?

    341基于詞袋的分布式表示 ?43?

    342基于自動(dòng)編碼器的分布式表示 ?43?

    35句子的分布式表示 ?46?

    351通用的句子表示 ?46?

    352任務(wù)相關(guān)的句子表示 ?49?

    36文檔的分布式表示 ?52?

    361通用的文檔分布式表示 ?53?

    362任務(wù)相關(guān)的文檔分布式表示 ?55?

    37進(jìn)一步閱讀 ?56

    習題 ?57

    第 4章預訓練語(yǔ)言模型 ?58?

    41概述 ?58?

    42 ELMo:源自語(yǔ)言模型的語(yǔ)境化分布式向量表示 ?58?

    421基于雙向 LSTM的語(yǔ)言模型 ?59?

    422適應下游任務(wù)的語(yǔ)境化 ELMo詞向量 ?60?

    43 GPT:生成式預訓練模型 ?61?

    431 Transformer62?

    432 GPT預訓練 ?63?

    433 GPT微調 ?64?

    44 BERT:雙向 Transformer編碼表示 ?65?

    441 BERT預訓練 ?66?

    442 BERT微調 ?68?

    443 XLNet:廣義自回歸預訓練模型 ?68?

    444 UniLM ?71?

    45進(jìn)一步閱讀 ?72

    習題 ?72

    第 5章文本分類(lèi) ?74?

    51概述 ?74?

    52傳統文本表示 ?75?

    目錄 XI?

    53特征選擇 ?76?

    531互信息法 ?76?

    532信息增益法 ?79?

    533卡方統計量法 ?80?

    534其他方法 ?81?

    54傳統分類(lèi)算法 ?82?

    541樸素貝葉斯模型 ?82?

    542 logistic回歸、 softmax回歸與最大熵模型 ?84?

    543支持向量機 ?86?

    544集成學(xué)習 ?88?

    55深度神經(jīng)網(wǎng)絡(luò )方法 ?89?

    551基于前饋神經(jīng)網(wǎng)絡(luò )的文本分類(lèi)方法 ?89?

    552基于卷積神經(jīng)網(wǎng)絡(luò )的文本分類(lèi)方法 ?89?

    553基于循環(huán)神經(jīng)網(wǎng)絡(luò )的文本分類(lèi)方法 ?91?

    56文本分類(lèi)性能評估 ?94?

    57進(jìn)一步閱讀 ?97

    習題 ?97

    第 6章文本聚類(lèi) ?99?

    61概述 ?99?

    62文本相似性度量 ?99?

    621樣本間的相似性 ?100?

    622簇間的相似性 ?102?

    623樣本與簇之間的相似性 ?103?

    63文本聚類(lèi)算法 ?103?

    631 K-均值聚類(lèi) ?103?

    632單遍聚類(lèi) ?107?

    633層次聚類(lèi) ?108?

    634密度聚類(lèi) ?111?

    64性能評估 ?113?

    641外部標準 ?113?

    642內部標準 ?115?

    65進(jìn)一步閱讀 ?115

    習題 ?116

    第 7章主題模型 ?117?

    71概述 ?117?

    文本數據挖掘 (第 2版)?

    72潛在語(yǔ)義分析 ?118?

    721詞項-文檔矩陣的奇異值分解 ?118?

    722詞項和文檔的概念表示及相似度計算 ?121?

    73概率潛在語(yǔ)義分析 ?123?

    731模型假設 ?123?

    732參數學(xué)習 ?124?

    74潛在狄利克雷分布 ?125?

    741模型假設 ?125?

    742詞項和主題序列的聯(lián)合概率 ?127?

    743模型推斷 ?129?

    744新文檔的推斷 ?131?

    745 PLSA與 LDA的聯(lián)系與區別 ?132?

    75進(jìn)一步閱讀 ?132

    習題 ?133

    第 8章情感分析與觀(guān)點(diǎn)挖掘 ?135?

    81概述 ?135?

    82情感分析任務(wù)類(lèi)型 ?136?

    821按目標形式劃分 ?136?

    822按分析粒度劃分 ?137?

    83文檔或句子級情感分析方法 ?139?

    831基于規則的無(wú)監督情感分類(lèi) ?140?

    832基于傳統機器學(xué)習的監督情感分類(lèi) ?141?

    833深度神經(jīng)網(wǎng)絡(luò )方法 ?144?

    84詞語(yǔ)級情感分析與情感詞典構建 ?146?

    841基于語(yǔ)義知識庫的方法 ?147?

    842基于語(yǔ)料庫的方法 ?147?

    843情感詞典性能評估 ?149?

    85屬性級情感分析 ?150?

    851屬性抽取 ?150?

    852屬性情感分類(lèi) ?153?

    853主題與情感的生成式建模 ?157?

    86情感分析中的特殊問(wèn)題 ?159?

    861情感極性轉移問(wèn)題 ?159?

    862領(lǐng)域適應問(wèn)題 ?160?

    87文本情緒分析 ?163?

    871心理學(xué)情緒理論 ?163?

    目錄 XIII?

    872文本情緒識別 ?163?

    873情緒原因挖掘 ?165?

    88進(jìn)一步閱讀 ?167

    習題 ?168

    第 9章話(huà)題檢測與跟蹤 170?

    91概述 ?170?

    92術(shù)語(yǔ)與任務(wù) ?172?

    921術(shù)語(yǔ) ?172?

    922任務(wù) ?173?

    93報道或話(huà)題的表示與相似性計算 ?175?

    94話(huà)題檢測 ?177?

    941話(huà)題在線(xiàn)檢測 ?177?

    942話(huà)題回溯檢測 ?179?

    95話(huà)題跟蹤 ?179?

    96評估方法 ?181?

    97社交媒體話(huà)題檢測與跟蹤 ?182?

    971社交媒體話(huà)題檢測 ?182?

    972社交媒體話(huà)題跟蹤 ?184?

    98突發(fā)話(huà)題檢測 ?184?

    981突發(fā)狀態(tài)識別 ?185?

    982以文檔為中心的方法 ?187?

    983以特征為中心的方法 ?188?

    99進(jìn)一步閱讀 ?190

    習題 ?190

    第 10章信息抽取 191?

    101概述 ?191?

    102命名實(shí)體識別 ?193?

    1021基于規則的命名實(shí)體識別方法 ?194?

    1022基于有監督學(xué)習的命名實(shí)體識別方法 ?195?

    1023半監督的命名實(shí)體識別方法 ?201?

    1024命名實(shí)體識別方法評價(jià) ?203?

    103共指消解 ?204?

    1031基于規則的共指消解方法 ?205?

    1032數據驅動(dòng)的共指消解方法 ?207?

    1033共指消解評價(jià) ?210?

    文本數據挖掘 (第 2版)?

    104實(shí)體消歧 ?213?

    1041基于聚類(lèi)的實(shí)體消歧方法 ?213?

    1042基于鏈接的實(shí)體消歧 ?217?

    1043實(shí)體消歧任務(wù)的評價(jià)方法 ?223?

    105關(guān)系抽取 ?224?

    1051基于離散特征的關(guān)系分類(lèi)方法 ?226?

    1052基于分布式特征的關(guān)系分類(lèi)方法 ?232?

    1053基于遠程監督的關(guān)系分類(lèi)方法 ?234?

    1054關(guān)系分類(lèi)性能評價(jià) ?235?

    1055知識圖譜 ?235?

    106事件抽取 ?236?

    1061事件描述模板 ?236?

    1062事件抽取方法 ?238?

    1063事件抽取評價(jià) ?245?

    1064事理圖譜 ?245?

    107進(jìn)一步閱讀 ?246

    習題 ?247

    第 11章文本自動(dòng)摘要 ?248?

    111概述 ?248?

    112抽取式自動(dòng)摘要 ?249?

    1121句子重要性評估 ?250?

    1122基于約束的摘要生成方法 ?258?

    113壓縮式自動(dòng)摘要方法 ?259?

    1131句子壓縮方法 ?259?

    1132基于句子壓縮的自動(dòng)摘要方法 ?263?

    114理解式自動(dòng)摘要 ?265?

    1141基于信息融合的生成式摘要方法 ?265?

    1142基于編碼-解碼的生成式摘要方法 ?270?

    115基于查詢(xún)的自動(dòng)摘要 ?272?

    1151基于語(yǔ)言模型的相關(guān)性計算方法 ?272?

    1152基于關(guān)鍵詞語(yǔ)重合度的相關(guān)性計算方法 ?273?

    1153基于圖模型的相關(guān)性計算方法 ?273?

    116跨語(yǔ)言和多語(yǔ)言自動(dòng)摘要方法 ?274?

    1161跨語(yǔ)言自動(dòng)摘要 ?274?

    1162多語(yǔ)言自動(dòng)摘要 ?277?

    目錄 XV?

    117摘要質(zhì)量評估方法和相關(guān)評測 ?279?

    1171摘要質(zhì)量評估方法 ?279?

    1172相關(guān)評測活動(dòng) ?283?

    118進(jìn)一步閱讀 ?285

    習題 ?285

    第 12章技術(shù)應用 ?288?

    121概述 ?288?

    122電子病歷分析與挖掘系統 ?289?

    1221任務(wù)目標 ?289?

    1222數據準備和標注 ?290?

    1223系統實(shí)現 ?292?

    123多語(yǔ)言政策法規分析與挖掘系統 ?300?

    1231任務(wù)目標 ?300?

    1232數據采集和標注 ?301?

    1233系統實(shí)現 ?302

    習題 ?302

    參考文獻 ?303

    名詞術(shù)語(yǔ)索引 ?327?

    ?

    ?
  • 內容簡(jiǎn)介:
    文本數據挖掘是通過(guò)機器學(xué)習、自然語(yǔ)言處理和推理等相關(guān)技術(shù)或方法,理解、分析和挖掘文本的內 容,從而完成信息抽取、關(guān)系發(fā)現、熱點(diǎn)預測、文本分類(lèi)和自動(dòng)摘要等具體任務(wù)的信息處理技術(shù)?!段谋緮祿诰颍ǖ?版)》主 要介紹與文本數據挖掘有關(guān)的基本概念、理論模型和實(shí)現算法,包括數據預處理、文本表示、文本分類(lèi)、文本聚類(lèi)、主題模型、情感分析與觀(guān)點(diǎn)挖掘、話(huà)題檢測與跟蹤、信息抽取以及文本自動(dòng)摘要等,最后通過(guò) 具體實(shí)例展示相關(guān)技術(shù)在實(shí)際應用中的使用方法?!段谋緮祿诰颍ǖ?版)》書(shū)可作為高等院校計算機、自動(dòng)化、網(wǎng)絡(luò )安全、大數據分析等專(zhuān)業(yè),以及利用到文本信息處理的交 叉學(xué)科(如金融財經(jīng)、社會(huì )人文、生物醫藥等)的高年級本科生或研究生從事相關(guān)研究的入門(mén)參考書(shū),也可供相關(guān)技術(shù)研發(fā)人員閱讀和參考。
  • 作者簡(jiǎn)介:
    宗成慶,中國科學(xué)院自動(dòng)化所研究員、博士生導師,中國科學(xué)院大學(xué)崗位教授,ACL/CAAI/CCF Fellow,主要從事自然語(yǔ)言處理、機器翻譯和語(yǔ)言認知計算等研究,主持國家項目10余項,發(fā)表論文200余篇,出版《統計自然語(yǔ)言處理》、《文本數據挖掘》和Text Data Mining三部專(zhuān)著(zhù)及兩部譯著(zhù)。擔任國際計算語(yǔ)言學(xué)委員會(huì )(ICCL)委員,中國中文信息學(xué)會(huì )副理事長(cháng),曾任亞洲自然語(yǔ)言處理學(xué)會(huì )(AFNLP)主席,國際一流學(xué)術(shù)會(huì )議ACL’2015和COLING’2020程序委員會(huì )主席、ACL’2021大會(huì )主席。榮獲國家科技進(jìn)步獎二等獎和多個(gè)省部級及國家一級學(xué)會(huì )的科技獎勵,獲得北京市優(yōu)秀教師、中科院優(yōu)秀導師和國科大李佩教學(xué)名師等若干榮譽(yù)。享受?chē)鴦?wù)院特殊津貼。張家俊,中國科學(xué)院自動(dòng)化研究所研究員、中國科學(xué)院大學(xué)崗位教授、博士生導師,主要研究方向為機器翻譯和自然語(yǔ)言處理,獲得國家優(yōu)秀青年科學(xué)基金資助,入選中國科協(xié)首屆青年人才托舉工程、中國科學(xué)院青年創(chuàng )新促進(jìn)會(huì )優(yōu)秀會(huì )員和北京智源青年科學(xué)家。發(fā)表CCF-A/B類(lèi)論文80余篇,出版學(xué)術(shù)專(zhuān)著(zhù)2部,譯著(zhù)1部。獲得中國中文信息學(xué)會(huì )錢(qián)偉長(cháng)中文信息處理科學(xué)技術(shù)獎一等獎、青年創(chuàng )新獎一等獎和2020年北京市科學(xué)技術(shù)獎一等獎等。擔任中國中文信息學(xué)會(huì )青年工作委員會(huì )主任和機器翻譯專(zhuān)委會(huì )副主任。擔任ACL/EMNLP/COLING的(資深)領(lǐng)域主席和《自動(dòng)化學(xué)報》等期刊的編委。夏睿,南京理工大學(xué)計算機學(xué)院教授、博士生導師,研究領(lǐng)域為人工智能、自然語(yǔ)言處理、文本數據挖掘,在國內外重要期刊和會(huì )議發(fā)表論文60余篇,出版學(xué)術(shù)專(zhuān)著(zhù)2部,主持國家和省部級項目近10項,獲得國際計算語(yǔ)言學(xué)會(huì )年會(huì )ACL2019杰出論文獎、中國中文信息學(xué)會(huì )青年創(chuàng )新獎一等獎等榮譽(yù),獲得江蘇省杰出青年基金資助。
  • 目錄:
    第 1章緒論 1?

    11基本概念 1?

    12文本挖掘任務(wù) 2?

    13文本挖掘面臨的困難 5?

    14方法概述與本書(shū)的內容組織 8?

    15進(jìn)一步閱讀 ?10

    習題 ?11

    第 2章數據預處理和標注 ?12?

    21概述 ?12?

    22數據獲取 ?12?

    23數據預處理 ?16?

    24數據標注 ?18?

    25基本工具 ?20?

    251漢語(yǔ)自動(dòng)分詞與詞性標注 ?20?

    252句法分析 ?22?

    253 n元語(yǔ)法模型 ?23?

    26進(jìn)一步閱讀 ?24

    習題 ?24

    第 3章文本表示 ?25?

    31概述 ?25?

    32向量空間模型 ?25?

    321向量空間模型的基本概念 ?25?

    322特征項的構造與權重 ?26?

    323文本長(cháng)度規范化 ?27?

    324特征工程 ?28?

    325其他文本表示方法 ?30?

    33詞的分布式表示 ?31?

    文本數據挖掘 (第 2版)?

    331神經(jīng)網(wǎng)絡(luò )語(yǔ)言模型 ?32?

    332 C&W模型 ?36?

    333 CBOW與 Skip-gram模型 ?38?

    334噪聲對比估計與負采樣 ?39?

    335字詞混合的分布式表示方法 ?41?

    34短語(yǔ)的分布式表示 ?43?

    341基于詞袋的分布式表示 ?43?

    342基于自動(dòng)編碼器的分布式表示 ?43?

    35句子的分布式表示 ?46?

    351通用的句子表示 ?46?

    352任務(wù)相關(guān)的句子表示 ?49?

    36文檔的分布式表示 ?52?

    361通用的文檔分布式表示 ?53?

    362任務(wù)相關(guān)的文檔分布式表示 ?55?

    37進(jìn)一步閱讀 ?56

    習題 ?57

    第 4章預訓練語(yǔ)言模型 ?58?

    41概述 ?58?

    42 ELMo:源自語(yǔ)言模型的語(yǔ)境化分布式向量表示 ?58?

    421基于雙向 LSTM的語(yǔ)言模型 ?59?

    422適應下游任務(wù)的語(yǔ)境化 ELMo詞向量 ?60?

    43 GPT:生成式預訓練模型 ?61?

    431 Transformer62?

    432 GPT預訓練 ?63?

    433 GPT微調 ?64?

    44 BERT:雙向 Transformer編碼表示 ?65?

    441 BERT預訓練 ?66?

    442 BERT微調 ?68?

    443 XLNet:廣義自回歸預訓練模型 ?68?

    444 UniLM ?71?

    45進(jìn)一步閱讀 ?72

    習題 ?72

    第 5章文本分類(lèi) ?74?

    51概述 ?74?

    52傳統文本表示 ?75?

    目錄 XI?

    53特征選擇 ?76?

    531互信息法 ?76?

    532信息增益法 ?79?

    533卡方統計量法 ?80?

    534其他方法 ?81?

    54傳統分類(lèi)算法 ?82?

    541樸素貝葉斯模型 ?82?

    542 logistic回歸、 softmax回歸與最大熵模型 ?84?

    543支持向量機 ?86?

    544集成學(xué)習 ?88?

    55深度神經(jīng)網(wǎng)絡(luò )方法 ?89?

    551基于前饋神經(jīng)網(wǎng)絡(luò )的文本分類(lèi)方法 ?89?

    552基于卷積神經(jīng)網(wǎng)絡(luò )的文本分類(lèi)方法 ?89?

    553基于循環(huán)神經(jīng)網(wǎng)絡(luò )的文本分類(lèi)方法 ?91?

    56文本分類(lèi)性能評估 ?94?

    57進(jìn)一步閱讀 ?97

    習題 ?97

    第 6章文本聚類(lèi) ?99?

    61概述 ?99?

    62文本相似性度量 ?99?

    621樣本間的相似性 ?100?

    622簇間的相似性 ?102?

    623樣本與簇之間的相似性 ?103?

    63文本聚類(lèi)算法 ?103?

    631 K-均值聚類(lèi) ?103?

    632單遍聚類(lèi) ?107?

    633層次聚類(lèi) ?108?

    634密度聚類(lèi) ?111?

    64性能評估 ?113?

    641外部標準 ?113?

    642內部標準 ?115?

    65進(jìn)一步閱讀 ?115

    習題 ?116

    第 7章主題模型 ?117?

    71概述 ?117?

    文本數據挖掘 (第 2版)?

    72潛在語(yǔ)義分析 ?118?

    721詞項-文檔矩陣的奇異值分解 ?118?

    722詞項和文檔的概念表示及相似度計算 ?121?

    73概率潛在語(yǔ)義分析 ?123?

    731模型假設 ?123?

    732參數學(xué)習 ?124?

    74潛在狄利克雷分布 ?125?

    741模型假設 ?125?

    742詞項和主題序列的聯(lián)合概率 ?127?

    743模型推斷 ?129?

    744新文檔的推斷 ?131?

    745 PLSA與 LDA的聯(lián)系與區別 ?132?

    75進(jìn)一步閱讀 ?132

    習題 ?133

    第 8章情感分析與觀(guān)點(diǎn)挖掘 ?135?

    81概述 ?135?

    82情感分析任務(wù)類(lèi)型 ?136?

    821按目標形式劃分 ?136?

    822按分析粒度劃分 ?137?

    83文檔或句子級情感分析方法 ?139?

    831基于規則的無(wú)監督情感分類(lèi) ?140?

    832基于傳統機器學(xué)習的監督情感分類(lèi) ?141?

    833深度神經(jīng)網(wǎng)絡(luò )方法 ?144?

    84詞語(yǔ)級情感分析與情感詞典構建 ?146?

    841基于語(yǔ)義知識庫的方法 ?147?

    842基于語(yǔ)料庫的方法 ?147?

    843情感詞典性能評估 ?149?

    85屬性級情感分析 ?150?

    851屬性抽取 ?150?

    852屬性情感分類(lèi) ?153?

    853主題與情感的生成式建模 ?157?

    86情感分析中的特殊問(wèn)題 ?159?

    861情感極性轉移問(wèn)題 ?159?

    862領(lǐng)域適應問(wèn)題 ?160?

    87文本情緒分析 ?163?

    871心理學(xué)情緒理論 ?163?

    目錄 XIII?

    872文本情緒識別 ?163?

    873情緒原因挖掘 ?165?

    88進(jìn)一步閱讀 ?167

    習題 ?168

    第 9章話(huà)題檢測與跟蹤 170?

    91概述 ?170?

    92術(shù)語(yǔ)與任務(wù) ?172?

    921術(shù)語(yǔ) ?172?

    922任務(wù) ?173?

    93報道或話(huà)題的表示與相似性計算 ?175?

    94話(huà)題檢測 ?177?

    941話(huà)題在線(xiàn)檢測 ?177?

    942話(huà)題回溯檢測 ?179?

    95話(huà)題跟蹤 ?179?

    96評估方法 ?181?

    97社交媒體話(huà)題檢測與跟蹤 ?182?

    971社交媒體話(huà)題檢測 ?182?

    972社交媒體話(huà)題跟蹤 ?184?

    98突發(fā)話(huà)題檢測 ?184?

    981突發(fā)狀態(tài)識別 ?185?

    982以文檔為中心的方法 ?187?

    983以特征為中心的方法 ?188?

    99進(jìn)一步閱讀 ?190

    習題 ?190

    第 10章信息抽取 191?

    101概述 ?191?

    102命名實(shí)體識別 ?193?

    1021基于規則的命名實(shí)體識別方法 ?194?

    1022基于有監督學(xué)習的命名實(shí)體識別方法 ?195?

    1023半監督的命名實(shí)體識別方法 ?201?

    1024命名實(shí)體識別方法評價(jià) ?203?

    103共指消解 ?204?

    1031基于規則的共指消解方法 ?205?

    1032數據驅動(dòng)的共指消解方法 ?207?

    1033共指消解評價(jià) ?210?

    文本數據挖掘 (第 2版)?

    104實(shí)體消歧 ?213?

    1041基于聚類(lèi)的實(shí)體消歧方法 ?213?

    1042基于鏈接的實(shí)體消歧 ?217?

    1043實(shí)體消歧任務(wù)的評價(jià)方法 ?223?

    105關(guān)系抽取 ?224?

    1051基于離散特征的關(guān)系分類(lèi)方法 ?226?

    1052基于分布式特征的關(guān)系分類(lèi)方法 ?232?

    1053基于遠程監督的關(guān)系分類(lèi)方法 ?234?

    1054關(guān)系分類(lèi)性能評價(jià) ?235?

    1055知識圖譜 ?235?

    106事件抽取 ?236?

    1061事件描述模板 ?236?

    1062事件抽取方法 ?238?

    1063事件抽取評價(jià) ?245?

    1064事理圖譜 ?245?

    107進(jìn)一步閱讀 ?246

    習題 ?247

    第 11章文本自動(dòng)摘要 ?248?

    111概述 ?248?

    112抽取式自動(dòng)摘要 ?249?

    1121句子重要性評估 ?250?

    1122基于約束的摘要生成方法 ?258?

    113壓縮式自動(dòng)摘要方法 ?259?

    1131句子壓縮方法 ?259?

    1132基于句子壓縮的自動(dòng)摘要方法 ?263?

    114理解式自動(dòng)摘要 ?265?

    1141基于信息融合的生成式摘要方法 ?265?

    1142基于編碼-解碼的生成式摘要方法 ?270?

    115基于查詢(xún)的自動(dòng)摘要 ?272?

    1151基于語(yǔ)言模型的相關(guān)性計算方法 ?272?

    1152基于關(guān)鍵詞語(yǔ)重合度的相關(guān)性計算方法 ?273?

    1153基于圖模型的相關(guān)性計算方法 ?273?

    116跨語(yǔ)言和多語(yǔ)言自動(dòng)摘要方法 ?274?

    1161跨語(yǔ)言自動(dòng)摘要 ?274?

    1162多語(yǔ)言自動(dòng)摘要 ?277?

    目錄 XV?

    117摘要質(zhì)量評估方法和相關(guān)評測 ?279?

    1171摘要質(zhì)量評估方法 ?279?

    1172相關(guān)評測活動(dòng) ?283?

    118進(jìn)一步閱讀 ?285

    習題 ?285

    第 12章技術(shù)應用 ?288?

    121概述 ?288?

    122電子病歷分析與挖掘系統 ?289?

    1221任務(wù)目標 ?289?

    1222數據準備和標注 ?290?

    1223系統實(shí)現 ?292?

    123多語(yǔ)言政策法規分析與挖掘系統 ?300?

    1231任務(wù)目標 ?300?

    1232數據采集和標注 ?301?

    1233系統實(shí)現 ?302

    習題 ?302

    參考文獻 ?303

    名詞術(shù)語(yǔ)索引 ?327?

    ?

    ?
查看詳情
12
您可能感興趣 / 更多
文本數據挖掘(第2版)
自然語(yǔ)言處理基礎與大模型
宗成慶、 趙陽(yáng)、飛槳教材編寫(xiě)組
文本數據挖掘(第2版)
文本數據挖掘(英文版)
宗成慶;夏睿;張家俊
文本數據挖掘(第2版)
文本數據挖掘
宗成慶;夏睿;張家俊
文本數據挖掘(第2版)
統計自然語(yǔ)言處理(第2版)
宗成慶 著(zhù)
文本數據挖掘(第2版)
統計自然語(yǔ)言處理
宗成慶