SenseTime发布SenseNova 4.0,带来全新AI体验

(SeaPRwire) –   香港, 2024年2月6日 — SenseTime发布SenseNova 4.0,这是对基础模型集进行了多维升级。SenseNova 4.0在知识覆盖范围、推理能力、长文本理解能力、数值推理能力、代码生成能力以及多模态交互能力等方面都有了更大的提升。SenseTime的最新大语言模型(“LLM”)通用版本SenseChat V4在整体性能上与GPT-4持平,在长文本理解和代码类任务上超过GPT-3.5。(API应用网站:

SenseTime还推出了SenseChat Function Call & Assistants API,这是其首个多模态调用API。通过将大模型与应用服务工具相连接,它大大降低了开发人员利用大模型的门槛。在此基础上,SenseTime推出了数据分析工具Office Raccoon,将大模型能力转化为实用应用。

SenseTime的SenseNova基础模型集解锁了广泛的AI应用,如办公场景下的SenseChat-DataAnalysis V4、医疗领域的SenseChat-Medical V4、智能驾驶和工业场景下的SenseChat-Vision V4,以及创意使用的SenseMirage V4,这些应用都可以以更高效和成本效益的方式实现。

SenseTime的SenseChat LLM已经帮助超过500家客户在金融、手机、医疗、汽车、房地产、能源、媒体和工业制造等多个行业实现智能转型。

SenseTime最新的基础模型套件以及其产品和工具,为实现人工通用智能(“AGI”)奠定了坚实基础,通过“大模型+”概念在各种场景和行业扩展大模型应用范围,拓展大模型应用新境界。

功能强大的基础模型集与按需AI能力

SenseNova 4.0提供各种灵活的API接口和服务。开发人员可以轻松地利用SenseNova的多样技能实现更高效和低成本的各种AI应用。

SenseNova的升级得益于其LLM的升级。最新通用LLM版本SenseChat V4支持4k、32k、128k词汇量,在知识理解、阅读理解、长文本理解、推理、数学、代码方面都有显著提升。其整体性能与GPT-4持平,在长文本理解和代码类任务上表现优于GPT-4。SenseChat V4在权威人工评估平台HumanEval上的一次通过率为75.6%,与GPT-4的74.4%持平。

根据开放智能评估平台的数据,SenseChat V4的整体性能与GPT-4持平。
根据开放智能评估平台的数据,SenseChat V4的整体性能与GPT-4持平。

上图显示在不同上下文长度(横轴)和不同上下文位置(纵轴)下,SenseChat-128k和SenseChat-32k提取关键信息的准确率。红色表示提取准确率较低,绿色表示提取准确率较高。结果显示,在上下文长度扩展到128k或32k时,SenseChat V4保持近乎完美的提取成功率,而GPT4-128k和GPT4-32K的提取结果不如SenseChat V4。
上图显示在不同上下文长度(横轴)和不同上下文位置(纵轴)下,SenseChat-128k和SenseChat-32k提取关键信息的准确率。红色表示提取准确率较低,绿色表示提取准确率较高。结果显示,在上下文长度扩展到128k或32k时,SenseChat V4保持近乎完美的提取成功率,而GPT4-128k和GPT4-32K的提取结果不如SenseChat V4。

SenseNova新的代码解释器SenseChat-DataAnalysis V4在数据分析场景下的准确率为85.71%,超过了GPT-4,涵盖了1000多个问题。它可以处理复杂的多种表格和文件形式;并支持常见的数据清洗、操作、对比分析、趋势分析、预测分析和可视化等任务。可应用于金融分析、商业分析、销售预测、市场分析和宏观分析等场景。

SenseTime的升级医疗LLM SenseChat-Medical V4在多轮对话、上下文理解和工具调用等方面都有了更强大的能力。它可以处理专业医疗问答、复杂医疗任务推理、智能诊断以及多模态医疗文件交互问答。SenseChat-Medical V4的整体性能与GPT-4持平,在2023年药师执业考试LLM评估和医疗领域LLM评价标准MedBench中排名第二,前者中甚至超过了GPT-4的两个项目。

SenseChat-Medical V4在2023年药师执业考试LLM评估的总分中排名第二,在两个项目中超过GPT-4。
SenseChat-Medical V4在2023年药师执业考试LLM评估的总分中排名第二,在两个项目中超过GPT-4。

多模态AI代表大模型演进的重要阶段。参数达30亿的大多模态模型(“LMM”)SenseChat-Vision V4在图像和文本理解能力上处于世界领先水平,在权威LMM评估标准MME Benchmark中总分超过GPT-4(2199.5对1926.57),有助于智能驾驶、智能车厢以及电力行业等领域的实用应用升级。

MME Benchmark从定位、名人识别、风景识别、OCR、数学计算等14个维度对LMM进行评估。
MME Benchmark从定位、名人识别、风景识别、OCR、数学计算等14个维度对LMM进行评估。

升级后的文本到图像生成模型SenseMirage V4,通过参数增加到10亿,可以生成具有更丰富上下文、细节和质感的电影级海报。

本文由第三方内容提供商提供。SeaPRwire (https://www.seaprwire.com/)对此不作任何保证或陈述。

分类: 头条新闻,日常新闻

SeaPRwire为公司和机构提供全球新闻稿发布,覆盖超过6,500个媒体库、86,000名编辑和记者,以及350万以上终端桌面和手机App。SeaPRwire支持英、日、德、韩、法、俄、印尼、马来、越南、中文等多种语言新闻稿发布。