微軟推出新工具讓開發者用文字描述快速建立 AI 行為測試案例
AI 新聞快訊:微軟於週二正式對外發布一款名為 Adaptive Spec-driven Scoring for Evaluation and Regression Testing(簡稱 ASSERT)的開源框架,專門用於快速建立 AI 行為評估流程。根據框架名稱所透露的設計邏輯,其核心概念是以「規格描述驅動評分」…
AI 新聞快訊:微軟於週二正式對外發布一款名為 Adaptive Spec-driven Scoring for Evaluation and Regression Testing(簡稱 ASSERT)的開源框架,專門用於快速建立 AI 行為評估流程。根據框架名稱所透露的設計邏輯,其核心概念是以「規格描述驅動評分」…
AI 新聞快訊:Uber 日前宣布針對員工的 AI 工具使用費用設置上限,起因是公司此前積極鼓勵員工盡可能使用 AI,結果在短短四個月內便耗盡了相關預算,公司隨即從開放姿態急轉為費用管控模式。從鼓勵放開使用到緊急設限,前後轉折僅歷四個月,凸顯出企業在大規模推動 AI 採用時,若未同步建立費用追蹤機制,實際耗用速度可…
AI 新聞快訊:OpenAI 近日公開呼籲全球共同正視青少年 AI 安全議題,提出應建立一個國際性專責機構,專門統籌制定針對未成年人使用 AI 的保護標準與規範框架。此倡議的核心關切在於,當前各國對於青少年接觸 AI 系統的監管尚無統一標準,潛在風險因此難以系統性管控。OpenAI 認為,單靠企業自律或個別國家立法…
AI 新聞快訊:OpenAI 近期發布了一批針對不同職能角色設計的 Codex 擴充工具,涵蓋外掛程式(plugins)、整合網站與標註功能(annotations),目標是讓分析師、行銷人員、設計師、投資人等非工程背景的團隊成員,也能直接透過 Codex 的 AI 能力提升日常工作效率。這波更新的核心思路是將 C…
AI 新聞快訊:保險公司 Travelers 與 OpenAI 合作,打造了一套 AI 驅動的理賠助理(Claim Assistant)系統。該系統主要解決三個痛點:第一,引導客戶逐步完成理賠申請流程,降低填表錯誤與行政摩擦,讓不熟悉保險程序的一般用戶也能順利提交申請;第二,提供全天候 24 小時、每週七天不間斷的…
AI 新聞快訊:WindBorne 的競爭優勢在於同時掌握資料蒐集與模型建構兩端。該公司目前在全球 15 個地點持續施放氣象氣球,任何時間點都有約 400 顆氣球在空中飛行,即時讀取大氣感測數據。最新天氣預報模型的精度提升,關鍵不在於換用更大的模型架構,而在於改進氣球資料輸入模型的方式——亦即資料前處理與同化流程的…
AI 新聞快訊:Anthropic 曾被視為大型語言模型領域的後起之秀,如今已成長為具備頂尖企業客戶群的 AI 強權。原文摘要資訊有限,詳細內容請見原文連結。…
AI 新聞快訊:OpenAI 近期發布《知識工作的下一個時代》報告,聚焦旗下 AI 程式設計工具 Codex 如何重塑企業與個人的生產力模式。報告涵蓋四大應用方向:AI 驅動的研究探索、資料分析自動化、工作流程整合,以及內容創作輔助。Codex 的核心能力在於能夠理解自然語言指令並轉化為可執行的程式碼或操作,讓非技…
AI 新聞快訊:佛羅里達州政府對 OpenAI 及其執行長 Sam Altman 提起訴訟,成為美國史上首例州政府針對生成式 AI 公司提出的此類法律行動。訴訟的核心爭議之一,涉及去年發生於佛羅里達州立大學的一起槍擊事件,以及 ChatGPT 在該事件中所扮演的疑似角色。州政府指控 OpenAI 的產品在暴力事件中…
AI 新聞快訊:Nvidia 正式進軍估值達 2000 億美元的消費級 CPU 市場,核心策略是與微軟、戴爾、惠普合作,共同推出搭載 AI 代理人(AI Agent)功能的個人電腦產品線。AI Agent PC 的設計理念在於讓 AI 能在本地端自主執行複雜任務,打破現有 PC 以被動工具為主的使用模式。若 Nvi…