● MIT 開源
在你花一塊錢做 AI 之前,先花 30 秒看你的資料夠不夠格餵 AI
DataReady 是一支資料準備度健檢工具。掃描你的文件資料夾,30 秒內給你一份 0 到 100 的客觀分數與紅綠燈,告訴你「以現在的資料直接做 AI / RAG,會卡在哪裡」。
你看到的是一場很厲害的 RAG demo,用的是乾淨樣本。你看不到的是公司真正的資料:掃描影像 PDF、東一份西一份的 Excel、十個版本的「最終版」、五年沒人更新的共用磁碟。把這種資料接上 AI,得到的不是智慧,是一本正經的胡說。問題是,在你簽下預算、立下 KPI 之前,沒有人先量過你的資料到底有多糟。DataReady 就是來做這件量測的。
打開 report.html,你會拿到一個總分、紅綠燈、最該注意的紅旗清單,以及六大維度的計分卡。
文字能否被機器抽出,還是卡在掃描影像、加密、損毀檔。
有無標題層級、表格是否規整、版面是否一致。
文件長度與語意邊界是否利於檢索切塊。
重複與近似重複檔比例、版本是否混亂。
內容是否夠新、過期檔比例。
檔名是否有語意、目錄是否有組織。
只用 Python 標準函式庫,沒有 PyTorch、沒有 C 擴充、不用 GPU。乾淨、好過資安審查、跑得動舊環境。
絕不上傳任何檔案或內容,所有分析都在你的機器上完成。遙測預設關閉。
只讀取、評分、產報告,絕不碰你的檔案。
這條線是故意畫的。診斷可以自動化,治療不行。把又髒又散的真實資料變成可用的 AI 資產,高度依賴你所在產業的脈絡。針對金融、醫療、公共關係、政府等產業的進階客製規則與深度診斷,由 Peakstar 於合作專案中提供。
如果你的報告是黃燈或紅燈,那不是壞消息,而是在投入預算前先看見問題的機會。Peakstar 在台灣與日本中小企業每天在做的,就是把卡在「資料」這一關的問題解開。