色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

通過利用機器學習模型破譯古籍

星星科技指導員 ? 來源:NVIDIA ? 作者:Michelle Horton ? 2022-04-08 09:47 ? 次閱讀

為了揭示過去的秘密,世界各地的歷史學者花費畢生精力翻譯古代手稿。圣母大學的一個研究小組希望幫助這項任務,用一種新開發(fā)的機器學習模型來翻譯和記錄幾百年前的手寫文檔。

利用圣加爾修道院圖書館的數(shù)字化手稿和一個考慮到人類感知的機器學習模型 study 在深度學習轉錄能力方面有顯著提高。

“我們正在處理歷史文件,這些文件的書寫風格早已過時,可以追溯到幾個世紀以前,并且使用拉丁語等語言,而拉丁語已經(jīng)很少使用了。你可以得到這些材料的美麗照片,但我們已經(jīng)著手做的是以一種模仿專家讀者眼睛對頁面感知的方式自動轉錄,并提供快速、可搜索的文本閱讀,”圣母大學副教授、資深作者沃爾特·舍勒在新聞稿中說。

圣加爾修道院圖書館建于 719 年,是世界上最古老、最豐富的圖書館藏品之一。該圖書館藏有大約 160000 卷書和 2000 份手稿,可追溯到八世紀。在羊皮紙上用現(xiàn)在很少使用的語言手工書寫,這些材料中的許多尚未被閱讀——這是一筆潛在的歷史檔案財富,等待發(fā)掘。

機器學習方法能夠自動轉錄這些類型的歷史文件已經(jīng)在工作中,但挑戰(zhàn)仍然存在。

到目前為止,大型數(shù)據(jù)集對于提高這些語言模型的性能是必不可少的。由于可供查閱的書籍數(shù)量巨大,這項工作需要時間,并且需要相對較少的專家學者進行注釋。缺少知識,如從未編纂過的中世紀拉丁語詞典,構成了更大的障礙。

該團隊將傳統(tǒng)的機器學習方法與研究物理世界和人類行為之間關系的視覺心理物理學相結合,以創(chuàng)建更多信息豐富的注釋。在這種情況下,他們在處理古代文本時將人類視覺測量納入神經(jīng)網(wǎng)絡的訓練過程。

“這是機器學習中通常不使用的策略。我們通過這些心理物理測量來標記數(shù)據(jù),這些測量直接來自于通過行為測量對感知進行的心理學研究。然后,我們通知網(wǎng)絡在感知這些角色方面的常見困難,并可以根據(jù)這些測量結果進行糾正,” Scheirer 說。

為了訓練、驗證和測試這些模型,研究人員使用了一套來自圣加爾的可追溯到九世紀的數(shù)字化手寫拉丁手稿。他們要求專家閱讀并將文本行中的手動抄本輸入定制的軟件中。測量每次抄寫的時間,可以洞察單詞、字符或段落的難度。根據(jù)作者的說法,這些數(shù)據(jù)有助于減少算法中的錯誤,并提供更真實的讀數(shù)。

所有的實驗都是使用 cuDNN-accelerated PyTorch 深度學習框架和 GPU 。“如果沒有 NVIDIA 硬件和軟件,我們肯定不可能完成我們所做的事情。

pYYBAGJPlEWAa7tcAAGssGNMcGs826.png

該研究引入了一種新的深度學習損失公式,該公式結合了人類視覺測量,可應用于手寫文檔轉錄的不同處理管道。信貸: Scheirer 等人/ IEEE

團隊仍在努力改進某些方面。損壞和不完整的文檔以及插圖和縮寫對模型提出了特殊的挑戰(zhàn)。

“由于互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)和 GPU 硬件,人工智能達到了拐點,這將使文化遺產(chǎn)和人文學科與其他領域一樣受益。我們只是初步了解我們可以對這個項目做些什么。

關于作者

Michelle Horton 是 NVIDIA 的高級開發(fā)人員通信經(jīng)理,擁有通信經(jīng)理和科學作家的背景。她在 NVIDIA 為開發(fā)者博客撰文,重點介紹了開發(fā)者使用 NVIDIA 技術的多種方式。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4753

    瀏覽量

    129067
  • 互聯(lián)網(wǎng)

    關注

    54

    文章

    11168

    瀏覽量

    103484
  • 機器學習
    +關注

    關注

    66

    文章

    8425

    瀏覽量

    132772
收藏 人收藏

    評論

    相關推薦

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型

    。 多模態(tài)融合的創(chuàng)新與突破 機器人控制技術的另一個重要突破在于多模態(tài)大模型的應用。相比于僅通過文字進行人機交互的傳統(tǒng)方法,現(xiàn)代機器人能夠融合視覺、聲音、定位等多模態(tài)輸入信息,為任務執(zhí)行
    發(fā)表于 12-29 23:04

    《具身智能機器人系統(tǒng)》第7-9章閱讀心得之具身智能機器人與大模型

    醫(yī)療領域,手術輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用模型優(yōu)化手術路徑規(guī)劃。工業(yè)場景中,協(xié)作機器人面臨的主要挑戰(zhàn)是快速適應新工藝流程。具身智
    發(fā)表于 12-24 15:03

    什么是機器學習通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統(tǒng)具有人的學習能力以便實現(xiàn)人工智能。因為沒有學習能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?448次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?<b class='flag-5'>通過</b><b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度學習
    的頭像 發(fā)表于 10-23 15:25 ?930次閱讀

    AI大模型與傳統(tǒng)機器學習的區(qū)別

    AI大模型與傳統(tǒng)機器學習在多個方面存在顯著的區(qū)別。以下是對這些區(qū)別的介紹: 一、模型規(guī)模與復雜度 AI大模型 :通常包含數(shù)十億甚至數(shù)萬億的參
    的頭像 發(fā)表于 10-23 15:01 ?735次閱讀

    構建語音控制機器人 - 線性模型機器學習

    輪子并識別音頻信號,但它仍然無法通過語音命令控制或按預定義路徑行駛。 線性控制模型 首先要解決的問題是實現(xiàn)直線驅動。為此,我們使用線性模型來控制提供給車輪的電壓。使用線性模型適合對汽車
    的頭像 發(fā)表于 10-02 16:31 ?225次閱讀
    構建語音控制<b class='flag-5'>機器</b>人 - 線性<b class='flag-5'>模型</b>和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環(huán)節(jié),目標是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預測任務,可以利用
    發(fā)表于 08-14 18:00

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    今天來學習大語言模型在自然語言理解方面的原理以及問答回復實現(xiàn)。 主要是基于深度學習和自然語言處理技術。 大語言模型涉及以下幾個過程: 數(shù)據(jù)收集:大語言
    發(fā)表于 08-02 11:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    這個程序不需要程序員編寫,而是由計算機自動生成。因此,人工編程方法依賴程序員思考的規(guī)則,而自動編程是計算機算法通過分析數(shù)據(jù)自行創(chuàng)建規(guī)則。 作者通過類比學生準備高考的過程來說明機器學習
    發(fā)表于 07-25 14:33

    Al大模型機器

    豐富的知識儲備。它們可以涵蓋各種領域的知識,并能夠回答相關問題。靈活性與通用性: AI大模型機器人具有很強的靈活性和通用性,能夠處理各種類型的任務和問題。持續(xù)學習和改進: 這些模型可以
    發(fā)表于 07-05 08:52

    人工神經(jīng)網(wǎng)絡與傳統(tǒng)機器學習模型的區(qū)別

    人工神經(jīng)網(wǎng)絡(ANN)與傳統(tǒng)機器學習模型之間的不同,包括其原理、數(shù)據(jù)處理能力、學習方法、適用場景及未來發(fā)展趨勢等方面,以期為讀者提供一個全面的視角。
    的頭像 發(fā)表于 07-04 14:08 ?1399次閱讀

    深度學習模型訓練過程詳解

    深度學習模型訓練是一個復雜且關鍵的過程,它涉及大量的數(shù)據(jù)、計算資源和精心設計的算法。訓練一個深度學習模型,本質(zhì)上是通過優(yōu)化算法調(diào)整
    的頭像 發(fā)表于 07-01 16:13 ?1364次閱讀

    大語言模型:原理與工程實踐+初識2

    前言 深度學習機器學習的分支,而大語言模型是深度學習的分支。機器
    發(fā)表于 05-13 00:09

    【大語言模型:原理與工程實踐】揭開大語言模型的面紗

    大語言模型(LLM)是人工智能領域的尖端技術,憑借龐大的參數(shù)量和卓越的語言理解能力贏得了廣泛關注。它基于深度學習利用神經(jīng)網(wǎng)絡框架來理解和生成自然語言文本。這些模型
    發(fā)表于 05-04 23:55

    深入探討機器學習的可視化技術

    機器學習可視化(簡稱ML可視化)一般是指通過圖形或交互方式表示機器學習模型、數(shù)據(jù)及其關系的過程。
    發(fā)表于 04-25 11:17 ?439次閱讀
    深入探討<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的可視化技術
    主站蜘蛛池模板: 蜜桃传媒一区二区亚洲AV| 啪啪后入内射日韩| 射90黑b丝女| 国产传媒18精品A片在线观看| 三叶草未满十八岁| 国产精品99久久久精品无码| 亚洲AV噜噜狠狠网址蜜桃尤物| 激情床戏视频片段有叫声| 国产系列在线亚洲视频| 日韩一区二区三区视频在线观看| 色偷偷网址| 成人在线观看播放| 久在线观看福利视频| a级男女性高爱潮高清试看| 人妻夜夜爽天天爽三区麻豆AV网站| 国产成人无码区免费内射一片色欲| 亚洲国产精品特色大片观看| 麻豆精品一区二正一三区| 成人免费一区二区无码视频| 亚洲精品午夜aaa级久久久久| 免费精品一区二区三区在线观看| 丰满的女朋友韩国版在线观看| 亚洲一品AV片观看五月色婷婷 | 草莓视频在线观看完整高清免费| 乌克兰10一12x video| 久久久无码AV精品亚洲A片软件| xart欧美一区在线播放| 亚洲伦理精品久久| 日本高清免费在线观看| 精品三级在线观看| 攻把受做得合不拢腿play| 最近日本字幕MV免费观看在线| 王雨纯羞羞| 青青草国产精品久久| 久久精品中文闷骚内射| 国产精品久久久久久久久久久 | yy8090韩国理伦片在线| 亚洲免费一区二区| 色多多深夜福利免费观看| 久久香蕉国产线看观看| 国产色精品VR一区二区|