對企業而言，文件處理向來是耗費大量人力和時間的工作：必須手動識別文件、將文件轉送給適當負責人，以及擷取相關資訊。數十年來，人們仰賴光學字元辨識 (OCR) 技術，將影像轉換為文字，以及透過複雜度各自不同的智慧文件處理 (IDP) 解決方案，從 OCR 文字中擷取所需欄位。

現在的做法，是使用機器學習 (ML) 演算法改善傳統資料擷取方法 (例如區塊 OCR 和規則型鍵/值組合擷取技術)，也就是訓練模型從結構化、半結構化和非結構化文件中擷取資料。然而，這些傳統方法通常需針對特定領域訓練機器學習模型，並為龐大訓練資料手動加上標籤，因此維護與建置都必須耗費大量時間和資源。

生成式 AI 與 LLM 的興起

隨著 IDP 不斷演進，以及近期 AI 技術大幅進步，企業開發與維護文件擷取解決方案的方式也產生變革。過去十二個月以來，生成式 AI 興起和大型語言模型 (LLM) 整合，為市場帶來前所未有的變化。這些創新技術不僅徹底改變市場，也開創嶄新可能，將先前無法自動化的文件自動化。

Deep Analysis 資深分析師兼著名 IDP 市場專家 Dan Lucarini 表示：「在長久的 IDP 發展史中，生成式 AI 是最重要的一大變革。這是有史以來，電腦首次能夠自行分類文件並擷取資料，完全不需要人工介入、訓練範例或先備知識。這在 AI 領域中稱為零樣本學習，也就是未經過事先接觸或訓練，就能識別文件。」

OpenAI GPT 系列和 Google Vertex AI 等 LLM 問世，為文件資料輸入自動化開創了全新可能。這些模型都經過大量資料的訓練，能掌握資料的個別元素和相關內容細節，因此擅長處理複雜的非結構化文件。此外，這些模型也能從廣泛的文件中擷取資訊，完全不需要事先訓練或定義規則。

運用傳統方法

雖然 LLM 革新了企業的文件處理自動化做法，但區塊 OCR、鍵/值組合擷取及機器學習等傳統方法，仍是從結構化和半結構化文件中擷取資料的最佳工具。LLM 可讓這些經實證有效的擷取技術更臻完善，進而輔助半結構化文件擷取方法。如此一來就不必建構非結構化文件模型。

Lucarini 表示：「我們經常遇到的疑問，是 GPT-4 等基礎 LLM 是否會取代根據資料集微調的機器學習模型。答案是『否』，短期內不會發生這種情況。基礎 LLM 很容易產生幻覺問題，對於必須完全準確擷取資料的傳統 IDP 應用程式而言並不可靠。此外，將基礎 LLM 用於讀取大量文件的成本太高。目前判別式機器學習模型仍是提高準確性和成本效益的最佳選擇。」

運用生成式 AI 充分提高效率

生成式 AI 仍可做為提高 IDP 產品效率的幫手。例如，使用者沒有規則運算式或程式碼編寫相關知識，也可以使用生成式 AI 提示來建立並微調新的文件模型。這項技術還能透過在文件中加上建議標籤，加快訓練階段速度。透過深入探究，使用者將能不斷發掘生成式 AI 在 IDP 中的創新應用層面，持續擴展其用途和影響。

生成式 AI 和 LLM 的最新進展，可說是掀起了一場巨大革命。這些技術不但滿足市場需求，也同時顛覆了市場態勢，為需要自動化處理大量文件的業務流程開創嶄新機會。只要融合這些創新技術與傳統擷取方法，企業就能簡化文件工作流程，將效率與生產力提升到更高境界。

標籤

生成式 AI 智慧自動化

Michael Guidry

Michael 是 Automation Anywhere 智慧文件處理策略與營運部門總經理。

智慧文件處理革命：生成式 AI 與大型語言模型的興起

瀏覽至內容

生成式 AI 與 LLM 的興起

運用傳統方法

運用生成式 AI 充分提高效率

部落格作者