在講課程《數(shù)據(jù)結(jié)構(gòu)和算法》的過程中,我給了學生們一個參考例程,希望他們能夠從程序中學到詞頻統(tǒng)計的方法。由于同學們底子比較薄弱,所以給出程序后,我希望同學們能夠認真的查閱程序中用到的每個函數(shù),了解其用法,這樣才能真正的搞懂程序,遺憾的是我的學生只是完成了實驗報告,而程序中很多函數(shù)的用法和含義根本就沒搞清楚。這種學法是應付式的學法,我極不贊成這樣的學習方式。所以才會有了此系列文章。也許是底子弱,也許是不愛學。
面對學生不愛學或者說學習不刻苦的狀況,我也只能把這些好的代碼傳播到網(wǎng)上,讓更多人能夠借力學習。這也是我現(xiàn)在會更加專注網(wǎng)絡(luò)傳播文章的原因吧。有了詞頻統(tǒng)計程序,我們就可以在這個基礎(chǔ)之上進行擴展,寫出更復雜的程序。我就用這樣的事例來寫出了一個完整的系列文章,告訴大家如何從基礎(chǔ)學起,然后再逐步的完善和深入,寫出功能更強大的程序,這樣的過程走一遍,才算是真正的掌握知識,才能把別人的知識轉(zhuǎn)化為屬于自己的知識。寫這個系列耗時一個多月,大家看文章花了多長時間呢?有了階梯,希望大家能好好利用和珍惜。
文本分析對于通信工程專業(yè)的學生而言,只是牛刀小試,等到完成詞頻統(tǒng)計的算法后大家還可以沿這條路繼續(xù)深入,比如進行語音信號的識別。先進行信號中數(shù)字的識別,再進行語義識別。這些可比字符的識別難多了。當下,文本信息已經(jīng)退居次席,人們更多在意的是語音和視頻。因此,語音信號和視頻信號處理是當下的技術(shù)熱點,讓我們一起由淺入深的學習吧。本課題可以作為畢業(yè)設(shè)計的題目,可以根據(jù)個人能力適當增加難度。
詞頻統(tǒng)計主要分為英文詞頻統(tǒng)計和中文詞頻統(tǒng)計。英文詞頻統(tǒng)計很簡單,可以借助MATLAB自帶函數(shù)進行斷句,然后再進行統(tǒng)計即可。中文詞頻統(tǒng)計相對復雜一些。關(guān)鍵在于如何使用合適的語料庫和如何精準匹配詞語。比如句中出現(xiàn)了“人工智能”四字詞,我們應該這四個字視為一個詞,而不能分析成為兩個詞。再者出現(xiàn)生僻詞語怎么辦?慢慢來,我們先從簡單的學起。依舊是老規(guī)矩,先看代碼!代碼中的注釋非常清晰,當看完程序后也就明了了。
原文標題:大學畢業(yè)設(shè)計一席談之四十八 詞頻統(tǒng)計(1)
文章出處:【微信公眾號:通信工程師專輯】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
原文標題:大學畢業(yè)設(shè)計一席談之四十八 詞頻統(tǒng)計(1)
文章出處:【微信號:gh_30373fc74387,微信公眾號:通信工程師專輯】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
相關(guān)推薦
一、設(shè)計簡介本畢業(yè)設(shè)計項目是基于STM32單片機的物聯(lián)網(wǎng)機智云智能家居系統(tǒng),包含原理圖PCB手機APP。智能家居系統(tǒng)以STM32C8T6單片機為核心,結(jié)合多種傳感器和執(zhí)行器,通過ESP8266實現(xiàn)
發(fā)表于 11-30 01:03
?1003次閱讀
又是一年畢設(shè)季,針對即將開始畢業(yè)設(shè)計的大學生,我們匯總了10+物聯(lián)網(wǎng)項目,供同學們參考。這些項目覆蓋了多個領(lǐng)域,希望可以為同學們提供豐富的靈感來源。我們鼓勵同學們根據(jù)自己的興趣和專業(yè)方向,選擇適合
發(fā)表于 11-26 15:26
?744次閱讀
NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛在香港科技大學獲得工程學榮譽博士學位。黃仁勛在現(xiàn)場發(fā)表演講并與香港科技大學校董會主席沈向洋教授展開了爐邊對話。
發(fā)表于 11-25 15:05
?416次閱讀
第四十八章 自學習分類實驗
在上一章節(jié)中,介紹了利用maix.KPU模塊實現(xiàn)了MNIST的手寫數(shù)據(jù)識別,本章將繼續(xù)介紹利用maix.KPU模塊實現(xiàn)的自學習分類。通過本章的學習,讀者將學習到自學習分類
發(fā)表于 11-20 09:22
又是一年畢設(shè)季,針對即將開始畢業(yè)設(shè)計的大學生,我們匯總了10+嵌入式linux項目,供同學們參考。這些項目覆蓋了多個領(lǐng)域,希望可以為同學們提供豐富的靈感來源。我們鼓勵同學們根據(jù)自己的興趣和專業(yè)方向
發(fā)表于 11-19 15:21
?539次閱讀
第16章-超聲波跟隨功能 基于STM32的三路超聲波自動跟隨小車 畢業(yè)設(shè)計 課程設(shè)計
發(fā)表于 08-21 15:26
?576次閱讀
近日,福祿克公司計量校準部首席電磁計量師楊勝利老師及多位電學技術(shù)支持老師們一行,受邀前往北京交通大學自動化系。在這里,他們與大四的本科生、研究生和博士生們共同開啟了一場意義非凡、別開生面的畢業(yè)
發(fā)表于 08-16 10:36
?556次閱讀
、護套等。 在光纜中,可以根據(jù)需要設(shè)計不同數(shù)量的光纖芯數(shù),這些光纖芯數(shù)可以是單芯、雙芯、四芯、八芯、十二芯、二十四芯、四十八芯、七十二芯、九十六芯等,甚至更多。芯數(shù)的多少主要取決于傳輸信息的容量需求、傳輸距離
發(fā)表于 08-13 09:39
?1011次閱讀
6月7日,浙江大學機械工程學院2024年“思看杯”本科畢業(yè)設(shè)計展在浙江大學紫金港校區(qū)機器人與智能裝備學生創(chuàng)新實踐基地順利召開,吸引了線上線下近千人的參與。 思看科技為本次畢業(yè)展提供了多
發(fā)表于 06-14 15:35
?552次閱讀
2024年第四十八屆中國電工儀器儀表產(chǎn)業(yè)發(fā)展技術(shù)研討暨展會,于2024年4月在杭州白金漢爵大酒店成功舉辦,眾多電工儀器儀表行業(yè)的領(lǐng)先企業(yè)和專業(yè)人士參與,展示最新的產(chǎn)品、技術(shù)和解決方案,探討行業(yè)發(fā)展趨勢和市場機遇。
發(fā)表于 05-15 14:42
?857次閱讀
上海矽朋微電子第四十八屆中國電工儀器儀表展展會回顧01現(xiàn)場盛況2024年4月9~10日,第四十八屆中國電工儀器儀表產(chǎn)業(yè)發(fā)展技術(shù)研討會及展會在產(chǎn)業(yè)鏈上下游熱切期盼中于杭州盛大召開。來自電網(wǎng)公司、計量
發(fā)表于 04-12 08:25
?297次閱讀
4月9-10日,第四十八屆中國電工儀器儀表產(chǎn)業(yè)發(fā)展技術(shù)研討會暨展會(以下簡稱“電力展”)在杭州舉行,立足于行業(yè)發(fā)展戰(zhàn)略和市場需求,著眼于新產(chǎn)品應用與技術(shù),電力展以二十多年的成功運營經(jīng)驗為依托,連接電工儀器儀表行業(yè)上下游,已發(fā)展成為行業(yè)最具規(guī)模和影響力的展會之一。
發(fā)表于 04-11 14:27
?653次閱讀
4月9-10日,第四十八屆中國電工儀器儀表產(chǎn)業(yè)發(fā)展技術(shù)研討會暨展會于杭州順利舉辦,現(xiàn)場匯聚電力終端企業(yè)、電網(wǎng)公司、計量檢測機構(gòu)、科研院所及各行業(yè)企業(yè)代表。在“雙碳”目標下,廣和通聚焦智能電網(wǎng)發(fā)展,攜多款高性能4G/5G模組、RedCap模組及智慧電網(wǎng)解決方案亮相T22-T23展位。
發(fā)表于 04-10 10:08
?471次閱讀
4月9-10日,第四十八屆中國電工儀器儀表產(chǎn)業(yè)發(fā)展技術(shù)研討會暨展會于杭州順利舉辦,現(xiàn)場匯聚電力終端企業(yè)、電網(wǎng)公司、計量檢測機構(gòu)、科研院所及各行業(yè)企業(yè)代表。在“雙碳”目標下,廣和通聚焦智能電網(wǎng)發(fā)展,攜多款高性能4G/5G模組、RedCap模組及智慧電網(wǎng)解決方案亮相T22-T23展位。
發(fā)表于 04-10 10:08
?492次閱讀
4月9-10日,第四十八屆中國電工儀器儀表產(chǎn)業(yè)發(fā)展技術(shù)研討會暨展會于杭州順利舉辦,現(xiàn)場匯聚電力終端企業(yè)、電網(wǎng)公司、計量檢測機構(gòu)、科研院所及各行業(yè)企業(yè)代表。
發(fā)表于 04-10 09:31
?346次閱讀
評論