亚洲欧洲日产韩国2020,无删减影视免费观看,一级高清毛片

背景

知識庫需求在各行各業中普遍存在，例如制造業中歷史故障知識庫、游戲社區平臺的內容知識庫、電商的商品推薦知識庫和醫療健康領域的掛號推薦知識庫系統等。為保證推薦系統的實效性和準確性，需要大量的數據/算法/軟件工程師的人力投入和包括硬件在內的物力投入。那么在自己的環境中搭建智能搜索大語言模型增強方案是必不可少的。因此，本篇內容主要為大語言模型方案的快速部署。該方案部署流程并不復雜，只需要您對于亞馬遜云科技相關服務有一個基本的了解即可。

方案架構圖與功能原理

該方案分為以下幾個核心功能模塊：

前端訪問界面：該方案提供了基于React的前端訪問界面。用戶可以通過網頁以REST API的形式進行智能文檔搜索等功能的操作。

REST API：通過集成了相應Amazon API Gateway和Amazon Lambda函數的實現和后端搜索引擎，數據庫和模型推理端點交互。

企業搜索引擎：基于Amazon OpenSearch或Amazon Kendra。可以基于雙向反饋的學習機制，自動持續迭代提高輸出匹配精準度。同時采用引導式搜索機制，提高搜索輸入描述的精準度。

數據源存儲：可選用多種存儲方式如數據庫，對象存儲等，在這里Amazon Kendra通過連接器獲取Amazon S3上的對象。

向量化數據注入：采用Amazon SageMaker的Notebook模塊或者Amazon Lambda程序將原始數據向量化后的數據注入Amazon OpenSearch。

智能搜索/引導/問答等功能模塊：采用Amazon Lambda函數實現和后端搜索引擎，數據庫和模型推理端點交互。

記錄數據庫：用戶反饋記錄存儲在數據庫Amazon DynamoDB。

機器學習模型：企業可以根據自身需要構建大語言模型和詞向量模型，將選取好的模型托管到Amazon SageMaker的endpoint節點。

反饋優化：用戶在前端頁面反饋最優搜索結果，通過手動或事件觸發器Amazon EventBridge觸發新的訓練任務并且重新部署到搜索引擎。

插件式應用：利用該方案核心能力可以與Amazon Lex集成以實現智能會話機器人功能，也可以與Amazon Connect集成實現智能語音客服功能。

實施步驟介紹

以smart-search v1版本為例，為大家講解方案的整個部署流程。

1、環境準備

首先您需要在您的開發環境中安裝好python 3、pip以及npm等通用工具，并保證您的環境中擁有16GB以上的存儲空間。根據您的使用習慣，您可以在自己的開發筆記本（Mac OS或Linux環境）上部署，也可以選擇EC2或者Cloud9進行部署。

2、CDK自動部署

2.1 獲取代碼安裝Amazon CDK包

獲取代碼后把代碼拷貝到指定目錄下。打開終端窗口，進入smart_search的軟件包，并切換到名為deployment文件夾下：

進入到deployment目錄后，相應的CDK部署操作均在該目錄下進行。然后安裝Amazon CDK包。

2.2 安裝CDK自動化部署腳本所需的所有依賴項和環境變量

在deployment目錄下運行以下命令安裝依賴庫：

然后將您的12位亞馬遜云科技賬號信息、Acess Key ID、Secret Access Key、以及需要部署的Region ID導入到環境變量中：

然后運行“cdk bootstrap”安裝賬戶和目標區域內的CDK工具包，例如：

2.3 在cdk.json可以進行自定義配置

該方案的默認配置文件在deployment目錄下的cdk.json文件中，如果想要自行配置需要部署哪些功能模塊，可以根據需要修改cdk.json的“context”部分。例如，如果需要修改部署哪些功能函數，可以對“selection”值進行修改。

默認的參數如下所示：

如果僅需要使用“支持knn的文檔搜索功能”，可以僅保留“knn_doc”。除此之外，還可以選擇通過修改cdk.json的其他相應參數來自定義部署方式、部署哪些插件和名稱和路徑等配置。

2.4 CDK命令自動化署

運行下面的命令將驗證環境并生成Amaon CloudFormation的json模版：

如果沒有報錯，則運行以下命令部署全部堆棧。

CDK部署將提供相關Amazon CloudFormation堆棧以及相關資源，例如Amazon Lambda、Amazon API Gateway、Amazon OpenSearch實例和Amazon SageMaker的notebook實例等，預計安裝的部署時間大約為30分鐘左右。

3、利用Amazon SageMaker的Notebook實例部署模型與數據導入

3.1 部署模型

3.1.1進入Amazon SageMaker控制臺，進入NoteBook Instances，選擇SmartSearchNoteBook實例，點擊“Open Jupyter”，進入SmartSearch的代碼主目錄，點擊“isearchjupyter”目錄進入，能看到包括Embbeding Model、LLM_Model等目錄，這兩個目錄包含模型部署腳本，而Script-Doc.ipynb腳本則會用于后面的文檔上傳，目錄如下圖所示：

3.1.2首先安裝Embbeding Model，進入“/isearchjupyter/Embbeding Model”目錄，能看到對應的幾個腳本。其中“EmbbedingModel_shibing624_text2vec-base-chinese.ipynb”為中文的詞向量模型，其他兩個為英文，打開相應腳本依次運行單元格，開始部署embbeding model。等待script部署完畢，成功部署后會在Amazon SageMaker的endpoint中看到名為“huggingface-inference-eb”的endpoint，狀態為“InService”。

3.1.3然后部署大語言模型，LLM_Model目錄下當前包含了中文和英文的大語言模型庫。這里先為大家介紹中文的大語言模型的部署方法，找到isearchjupyter/LLM_Model/llm_chinese/code/inference.py，該文件定義了大語言模型的統一部署方法。大語言模型可以通過唯一的名稱進行部署，把該唯一名稱聲明為“LLM_NAME”的參數值，作為參數傳遞給部署腳本。可以根據大語言模型的文檔來確定“LLM_NAME”的值。打開網址后對照該文檔找到該模型部署的唯一名稱，然后粘貼到為“LLM_NAME”賦值的位置即可，可以參照該方法舉一反三，指定項目中需要使用的大語言模型。修改inference.py文件后進入“isearchjupyter/LLM_Model/llm_chinese/“目錄，運行該目錄的script。等待script 部署完畢，成功部署后會在Amazon SageMaker的endpoint中看到名為“pytorch-inference-llm-v1”的endpoint。

如果選擇部署英文大語言模型，部署方式類似，需要將英文大語言模型的參數填入LLM_Model/llm_english/code/inference.py文件的“LLM_NAME”參數中。找到該大語言模型項目名稱，則然后復制該名稱再粘貼到為“LLM_NAME”賦值的位置，可以用該方法進行舉一反三，指定任意一個滿足業務需求的大語言模型。進入“isearchjupyter/LLM_Model/llm_english/”的目錄下，依次運行該目錄下英文大語言模型的腳本的部署單元格。如下圖所示：

3.1.4安裝完成后，看到兩個endpoint已經在”InService”狀態，如下圖：

3.2 知識庫數據上傳

3.2.1數據準備。進入jupyter的目錄“/isearchjupyter”，在“docs”目錄，將上傳所需要的word、excel或pdf等格式的文檔進行上傳，該文件夾下已經提供了用于測試的樣例文件“sample.docx”。

3.2.2 進入Script-Doc.ipynb，修改單元格“Hyperparameter”的如下參數，folder_path為指定的docs目錄，index_name為Amazon OpenSearch的index名稱，如下圖：

然后從頭運行這個script，完成數據導入。

4、配置Web UI

4.1 進入smart_search/ search-web-knn目錄，該目錄包含基于React的前端界面代碼。然后對/src/pages/common/constants.js文件進行編輯，如下圖所示：

Mainapi常變量指定了前端調用的API入口。該值可以從網頁端進入API Gateway中獲取，進入“smartsearch-api”的Stages側邊欄，將prod stage的involke URL賦值給constants.js的mainapi常變量。

4.2 檢查主頁面參數配置。smart_search/search-web-knn/src/pages/MainSearchDoc.jsx為功能展示頁面，在該文件的last_index參數設置了頁面自動填充的默認index值，將上文Notebook實例部署的index name填入，如“docs”。

4.3 運行前端界面。進入目錄 search-web-knn，執行如下兩條命令：

然后運行以下命令啟動前端界面：

一切順利的話，將得到一個網頁版界面。在本地開發筆記本部署的默認訪問地址和端口號是localhost：3000，如果是EC2部署，需要啟用對應端口訪問的安全組策略，通過EC2的公網地址加端口號進行訪問。該前端頁面的使用方法為：將問題輸入搜索欄，配置index名稱和k-NN選項，點擊“Search”按鈕后您可以得到一個基于企業知識庫的大語言模型匯總回答。如下圖所示：

5、安裝擴展插件

5.1 與Amazon Lex集成實現智能聊天機器人

本方案已經集成了Amazon Lex的會話機器人功能，Amazon Lex當前在海外區可用。在cdk.json文件中，將“bot”加入extension鍵值處。

cdk部署成功后進入管理界面可以看到名為“llmbot”的對話機器人，如下圖：

該機器人可以方便地進行前端頁面的集成。

5.2 與Amazon Connect集成實現智能語音客服

Amazon Connect為亞馬遜云科技的云呼叫中心服務，該服務當前在海外區可用。該方案可以通過Amazon Lex機器人將大語言模型能力集成到Amazon Connect云呼叫中心中，通過以下幾個步驟可以使您獲得一個支持語音呼叫功能的智能客服機器人。

5.2.1 將上一步生成的llmbot機器人集成到現有Amazon Connect實例中。

5.2.2 然后進入Amazon Connect實例中，將smart-search/extension/connect里面的文件導入到Contact Flow中，并保存和發布。

5.2.3 最后在Amazon Connect中將呼入號碼與上一步配置的Contact Flow進行關聯。則所有呼入該號碼的語音通話將會連接到智能客服的呼叫服務流程。

正常情況下，智能客服將會識別呼入人的語音輸入，隨后集成到Amazon Connect的智能客服機器人會基于企業知識庫信息和大語言模型的能力進行以接近人類的邏輯方式進行語音回答。

6、資源清理

想要將資源進行清理時，請使用以下命令將所有堆棧進行刪除：

注意：通過Amazon SageMaker的Notebook實例創建的推理模型資源需要進行手動刪除，在Amazon SageMaker的“inference”邊欄進入“endpoint”，點擊“delete”，將所有endpoint進行刪除。

當堆棧創建的Amazon S3桶中已經有了數據或者存在其他手動創建或修改的資源時，則也需要手動刪除。

總結

通過此次部署，已經成功掌握了該方案的部署方法，也對該方案有了更深的了解。亞馬遜云科技將會對該方案進行持續的迭代與優化以支持更多的數據類型、模型庫與擴展功能，進而將方案的能力延伸到更多的業務場景中去。該方案可以解決許多行業和領域的專業或通用場景，通過使用該方案可以使用人工智能的最新進展和亞馬遜云科技的產品來為行業發展注入新的活力。

審核編輯黃宇

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

語言模型

語言模型

+關注

關注
0

文章
538

瀏覽量
10340
亞馬遜

亞馬遜

+關注

關注
8

文章
2680

瀏覽量
83604

亞馬遜云科技發布Amazon Trainium2實例

的發布，標志著亞馬遜云科技在人工智能訓練和部署領域邁出了重要一步。為了滿足用戶對高性能和高性價比的雙重需求，亞馬遜

發表于 12-27 14:57 ?296次閱讀

亞馬遜云科技與SAP推出GROW with SAP解決方案

近日，亞馬遜云科技與SAP攜手宣布了一項重要合作——在亞馬遜云科技平臺上提供GROW with SAP解決方案。這一舉措旨在幫助各種規模的企

發表于 12-24 16:44 ?385次閱讀

AI模型部署邊緣設備的奇妙之旅：目標檢測模型

以及邊緣計算能力的增強，越來越多的目標檢測應用開始直接在靠近數據源的邊緣設備上運行。這不僅減少了數據傳輸延遲，保護了用戶隱私，同時也減輕了云端服務器的壓力。然而，在邊緣端部署高效且準確的目標檢測模型

發表于 12-19 14:33

基于亞馬遜云科技的GROW with SAP解決方案助力企業簡化云端ERP部署

GROW with SAP解決方案將上架亞馬遜云科技Marketplace，助力企業快速應用ERP云軟件，并利用前沿生成式AI解決

發表于 12-09 15:11 ?252次閱讀

飛利浦與亞馬遜云科技擴展戰略合作，增強HealthSuite云服務能力并賦能生成式AI工作流

，全球健康科技領導者荷蘭皇家飛利浦與亞馬遜云科技擴展戰略合作，提供基于云端的飛利浦醫療信息化解決方案，覆蓋放射學、數字病理學、心臟病學1和人工智能高級可視化1等多個領域。此次合作旨在統

發表于 12-04 15:04 ?169次閱讀

飛利浦與<b class='flag-5'>亞馬遜</b><b class='flag-5'>云</b>科技擴展戰略合作，<b class='flag-5'>增強</b>HealthSuite<b class='flag-5'>云</b>服務能力并賦能生成式AI工作流

語言模型自動化的優點

語言模型自動化不僅優化了信息處理流程，提高了工作效率，還促進了跨文化交流，增強了人機交互的智能化水平。以下，是對

發表于 11-26 11:17 ?134次閱讀

搭建開源大語言模型服務的方法

本文我們將總結5種搭建開源大語言模型服務的方法，每種都附帶詳細的操作步驟，以及各自的優缺點。

發表于 10-29 09:17 ?265次閱讀

亞馬遜云科技上線Meta Llama 3.2模型

亞馬遜云科技近日宣布，Meta公司的新一代模型Llama 3.2已在其平臺上正式上線。該模型包括Meta首款多模態模型，現已在Amazon

發表于 10-11 18:08 ?502次閱讀

亞馬遜云科技正式上線Meta Llama 3.2模型

亞馬遜云科技宣布，Meta的新一代模型Llama 3.2，包括其首款多模態模型，現已在Amazon Bedrock和Amazon SageMaker中正式可用。

發表于 10-11 09:20 ?554次閱讀

GE醫療與亞馬遜云科技達成戰略合作，通過生成式AI加速醫療健康領域轉型

GE醫療已選擇亞馬遜云科技作為其戰略云服務合作伙伴，致力于推出全新的定制化基礎模型，加速創新醫療應用快速開發。 ? GE醫療將利用

發表于 08-29 16:38 ?303次閱讀

亞馬遜云科技接入百川智能和零一萬物基礎模型

近日，亞馬遜云科技在中國峰會上宣布，兩大中文基礎模型——百川智能的Baichuan2-7B和零一萬物的Yi-1.5 6B/9B/34B，即將或已正式登陸中國區域的SageMaker J

發表于 06-04 11:53 ?617次閱讀

【大語言模型：原理與工程實踐】大語言模型的應用

實際應用前需解決的挑戰。為提升大語言模型的性能，高級的提示詞技術可以促進大語言模型與環境進行動態交互，引導其生成和推理規劃。檢索增強生成

發表于 05-07 17:21

【大語言模型：原理與工程實踐】探索《大語言模型原理與工程實踐》2.0

讀者更好地把握大語言模型的應用場景和潛在價值。盡管涉及復雜的技術內容，作者盡力以通俗易懂的語言解釋概念，使得非專業背景的讀者也能夠跟上節奏。圖表和示例的運用進一步增強了書籍的可讀性。本

發表于 05-07 10:30

【大語言模型：原理與工程實踐】核心技術綜述

中應用，需要考慮到性能、可擴展性和安全性等因素。大語言模型正在快速發展，新技術不斷涌現。未來的研究可能集中在提高模型效率、理解和可解釋性以及確保

發表于 05-05 10:56

亞馬遜云科技與Anthropic加深合作 Amazon Bedrock再添Claude 3模型

模型具備行業領先的準確性、性能、速度和成本優勢。這一進展將增強各種規模的企業在其組織中快速測試、構建和部署生成式AI應用的能力。 "我們與Anthropic展開合作，旨在將領先的生成式

發表于 03-06 15:45 ?428次閱讀

色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

搜索歷史

了解亞馬遜云科技搭建智能搜索大語言模型增強方案的快速部署流程

評論