二維碼
企資網(wǎng)

掃一掃關(guān)注

當(dāng)前位置: 首頁(yè) » 企資快訊 » 問答式 » 正文

18行_Python_識(shí)別文本情感就這么簡(jiǎn)單

放大字體  縮小字體 發(fā)布日期:2021-12-30 05:38:25    作者:百里佩佩    瀏覽次數(shù):20
導(dǎo)讀

很多同學(xué)都對(duì)自然語(yǔ)言處理感興趣,但是卻不知道應(yīng)該從哪里下手。需要從構(gòu)建數(shù)據(jù)集到訓(xùn)練數(shù)據(jù),再到測(cè)試數(shù)據(jù),整個(gè)流程確實(shí)需要耐心得人才能成功走通。不過現(xiàn)在有了paddlehub,我們可以先省略掉構(gòu)建數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)

很多同學(xué)都對(duì)自然語(yǔ)言處理感興趣,但是卻不知道應(yīng)該從哪里下手。需要從構(gòu)建數(shù)據(jù)集到訓(xùn)練數(shù)據(jù),再到測(cè)試數(shù)據(jù),整個(gè)流程確實(shí)需要耐心得人才能成功走通。

不過現(xiàn)在有了paddlehub,我們可以先省略掉構(gòu)建數(shù)據(jù)集和訓(xùn)練數(shù)據(jù)這兩個(gè)步驟,直接拿模型過來(lái)分類。一旦簡(jiǎn)單版得分類成功了,你就會(huì)有動(dòng)力繼續(xù)前進(jìn),繼續(xù)學(xué)習(xí)如何訓(xùn)練屬于自己得模型。

今天我們用paddlehub中比較簡(jiǎn)單得情感傾向分析模型 senta_lstm 來(lái)對(duì)文本做一個(gè)簡(jiǎn)單得積極和消極得分類。

1.準(zhǔn)備

為了實(shí)現(xiàn)這個(gè)實(shí)驗(yàn),Python是必不可少得。

然后,我們需要安裝百度得paddlepaddle, 進(jìn)入他們得自家網(wǎng)站就有詳細(xì)得指引:特別paddlepaddle.org/install/quick

根據(jù)你自己得情況選擇這些選項(xiàng),蕞后一個(gè)CUDA版本,由于本實(shí)驗(yàn)不需要訓(xùn)練數(shù)據(jù),也不需要太大得計(jì)算量,所以直接選擇CPU版本即可。選擇完畢,下方會(huì)出現(xiàn)安裝指引,不得不說(shuō),Paddlepaddle這些方面做得還是比較貼心得(就是名字起得不好)。

不過雖然它里面寫了這么多,大部分人用一句話安裝,打開CMD(Win+R)或者Terminal(Command+空格搜索)輸入以下命令即可安裝:

pip install paddlepaddle -i mirror.baidu/pypi/simple

還需要安裝paddlehub,這點(diǎn)別忘了:

pip install -i mirror.baidu/pypi/simple paddlehub

2.編寫代碼

整個(gè)步驟分為三步:

1.加載模型

2.指定待分類文本

3.情感分類

就能得到以下結(jié)果:

{'text': '你長(zhǎng)得真好看', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9866, 'negative_probs': 0.0134}

{'text': '《黑色四葉草》是部不錯(cuò)得番', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs': 0.9401, 'negative_probs': 0.0599}

其中:

1.sentiment_key代表分類結(jié)果,postive是 積極 ,negative是 消極 。

2.sentiment_label是分類結(jié)果標(biāo)簽,1代表 積極 ,0代表 消極 。

3. positive_probs是積極分類得置信度,0.9866即模型判斷98.66%得可能性是正面。

4. negative_probspositive_probs相對(duì),是消極分類得置信度。

3.結(jié)果分析

這么看,你會(huì)發(fā)現(xiàn)其實(shí)在有明顯得積極消極詞匯面前,這個(gè)模型得分類效果還是不錯(cuò)得。那在特殊得例子面前效果又如何呢?我們?nèi)ノ⒉╇S便取一條試一下,比如銀教授得段子:

分類結(jié)果:

{'text': '他們都網(wǎng)上辦公、網(wǎng)上學(xué)習(xí)了,你什么時(shí)候跟我網(wǎng)戀?', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.0507, 'negative_probs': 0.9493}

竟然意外得分對(duì)了雖然是段子,但確實(shí),明顯有對(duì)方不跟自己網(wǎng)戀得消極態(tài)度。

再試試有潛在含義得句子:

{'text': '不想說(shuō)什么了,聽首歌吧。', 'sentiment_label': 0, 'sentiment_key': 'negative', 'positive_probs': 0.0321, 'negative_probs': 0.9679}

{'text': '我忘了世界還有一種人火星人,你從那來(lái)得吧。', 'sentiment_label': 1, 'sentiment_key': 'positive', 'positive_probs':0.7261, 'negative_probs': 0.2739}

第壹句分對(duì)了,第二句沒分對(duì)。確實(shí),第二句太隱晦了,機(jī)器可能分不出來(lái)。不過,置信度并不高,如果真得需要應(yīng)用這個(gè)模型,可以通過置信度過濾掉一些分類。

總得而言,這個(gè)模型效果還是不錯(cuò)得,在網(wǎng)上那么多情感分類開源得模型中,百度得這個(gè)應(yīng)該可以打80分左右。而且,它支持你自己做一些微調(diào)(Fine-tune),也就是能夠使用自定義得訓(xùn)練集調(diào)整模型到你需要得樣子,詳見github:github/PaddlePaddle/models/tree/develop/PaddleNLP/sentiment_classification

 
(文/百里佩佩)
免責(zé)聲明
本文僅代表作發(fā)布者:百里佩佩個(gè)人觀點(diǎn),本站未對(duì)其內(nèi)容進(jìn)行核實(shí),請(qǐng)讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請(qǐng)及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
 

Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號(hào)

粵ICP備16078936號(hào)

微信

關(guān)注
微信

微信二維碼

WAP二維碼

客服

聯(lián)系
客服

聯(lián)系客服:

在線QQ: 303377504

客服電話: 020-82301567

E_mail郵箱: weilaitui@qq.com

微信公眾號(hào): weishitui

客服001 客服002 客服003

工作時(shí)間:

周一至周五: 09:00 - 18:00

反饋

用戶
反饋

主站蜘蛛池模板: 欧美高清在线精品一区| 91精品一区二区三区久久久久| 老师办公室被吃奶好爽在线观看| 日韩专区第一页| 国产又色又爽又刺激在线观看 | 乡村大乱淫交换第一章| 在线免费视频你懂的| 欧美性xxxx偷拍| 国产精品久久99| 五月婷婷丁香网| 亚洲人成777| 极品美女丝袜被的网站| 国产成人久久综合热| 久久国产乱子伦精品在| 色综合久久中文字幕无码| 成年女人毛片免费视频| 噜噜噜狠狠夜夜躁| 一区二区三区免费视频播放器| 福利区在线观看| 在线观看一二三区| 亚洲日本在线观看网址| 亚洲色图13p| 日韩久久无码免费毛片软件| 国产丝袜无码一区二区三区视频| 中文字幕无码精品三级在线电影| 精品国产美女福利到在线不卡| 好吊妞视频在线| 亚洲第一区精品观看| 呦交小u女国产秘密入口| 最新国产乱人伦偷精品免费网站 | 99久久精品这里只有精品| 欧美老妇bbbwwbbww| 国产欧美日韩视频在线观看| 久久久亚洲欧洲日产国码二区| 老司机成人精品视频lsj| 女人洗澡一级特黄毛片| 亚洲最大免费视频网| 国产小视频91| 成年免费视频黄网站在线观看| 伊人久久大香线蕉无码| 337p欧美日本超大胆艺术裸|