Flutter for OpenHarmony:Flutter 三方库 dart_openai — 激发鸿蒙应用的 AIGC (AI 大模型/ChatGPT、Deepseek等) 无限创意(适配鸿蒙

Flutter for OpenHarmony:Flutter 三方库 dart_openai — 激发鸿蒙应用的 AIGC (AI 大模型/ChatGPT、Deepseek等) 无限创意(适配鸿蒙

欢迎加入开源鸿蒙跨平台社区:https://openharmonycrossplatform.ZEEKLOG.net

Flutter for OpenHarmony:Flutter 三方库 dart_openai — 激发鸿蒙应用的 AIGC (AI 大模型/ChatGPT、Deepseek等) 无限创意(适配鸿蒙 HarmonyOS Next ohos)

请添加图片描述

前言

随着生成式 AI(AIGC)浪潮席卷全球,将大语言模型(LLM)的智慧集成到移动应用中已成为大势所趋。无论是智能对话、代码生成,还是图像创作,AI 正在重塑我们的交互方式。

Flutter for OpenHarmony 开发中,我们如何让鸿蒙应用直接对话全球顶尖的 AI 模型?dart_openai 库通过对 OpenAI API 的完美封装,为我们提供了从文本(GPT-4)到图片(DALL·E)的全栈 AI 能力。今天,我们将实战如何在鸿蒙设备上构建一个具备思考能力的智能体。

一、为什么集成 OpenAI 到鸿蒙生态?

1.1 万物互联的“大脑”

鸿蒙系统主打分布式协同,而 AI 能作为这些逻辑的中枢。比如用户在鸿蒙手机上说:“根据我现在的健康数据(来自手表),给我制定一份晚餐食谱”,AI 能即时生成人性化的建议。

1.2 为什么在鸿蒙上使用该库?

  • 异步响应式流(Stream):天然支持 OpenAI 的流式输出(Streaming),让鸿蒙应用的聊天回显像打字机一样丝滑。
  • 配置极简:支持自定义 Base URL。这对于鸿蒙开发者在中国大陆环境下使用国内代理转发服务至关重要。
  • 功能完备:除了聊天,还涵盖了 Embedding、音频转文字、文件上传等所有官方能力。

1.3 AI 交互链路模型(Mermaid)

用户输入问题

OpenAI 客户端

代理/BaseURL 转换

OpenAI 核心服务器

LLM 推理引擎

生成结果流

JSON 解析与拦截

UI 状态自增刷新

鸿蒙页面打字机效果展示

二、核心 API 与功能讲解

2.1 引入依赖

pubspec.yaml 中配置:

dependencies:# OpenAI 官方协议封装dart_openai: ^5.1.0 

2.2 初始化与代理配置(重点)

在鸿蒙应用入口处设置 API Key 和端点。

import'package:dart_openai/dart_openai.dart';voidsetupAI(){OpenAI.apiKey ="YOUR_API_KEY";// 💡 适配鸿蒙国内开发:设置代理基准地址OpenAI.baseUrl ="https://your-custom-proxy.com";}
在这里插入图片描述

2.3 核心功能:流式聊天

让 AI 像人一样一个词一个词地蹦出来,拒绝等待长文时的“转圈圈”。

voidchatWithAi(String prompt){// 🎨 创建流式对话Stream<OpenAIStreamChatCompletionModel> chatStream =OpenAI.instance.chat.createStream( model:"gpt-4o", messages:[OpenAIChatCompletionChoiceMessageModel( content:[OpenAIChatCompletionChoiceMessageContentItemModel.text(prompt),], role:OpenAIChatMessageRole.user,),],); chatStream.listen((event){// ✅ 实战:获取当前片段并更新鸿蒙 UIfinal content = event.choices.first.delta.content;print(content?.first.text ??"");});}
在这里插入图片描述

三、鸿蒙应用实战场景

3.1 场景一:分布式智慧办公助手

在鸿蒙智慧屏(电视)上发起语音指令。通过 dart_openai 解析意图,AI 返回结构化的操作建议。随后应用通过鸿蒙的分布式总线,自动控制手机打开对应的文档。

在这里插入图片描述

3.2 场景二:个性化情感健康教练

结合鸿蒙穿戴设备捕获的压力指数。应用调用 OpenAI 的接口,让 AI 以“心理疏导员”的角色给用户发送安慰和呼吸训练建议。

在这里插入图片描述

四、OpenHarmony 平台适配建议

4.1 网络稳定性与超时重连

  • ✅ 建议:移动端网络环境复杂。在 listen Stream 时,务必包裹 onError 处理。在网络闪断后,利用 dart_openai 的断点续传思想或简单的重试机制,防止用户对话中断。

4.2 隐私合规与数据过滤

  • 📌 提醒:涉及到个人隐私(如身份证、家庭地址)时,在发送给 OpenAI 之前,建议在鸿蒙端利用本地正则库先进行脱敏处理。

4.3 UI 线程性能管控

  • ⚠️ 警告:Markdown 的实时解析是一项耗电操作。当 AI 快速输出带代码块的长文时,建议对 Markdown 刷新频率进行“节流”(Throttling),确保鸿蒙手机在 120Hz 下依然冰凉丝滑。

五、完整示例:简易 AI 问答器

演示如何在鸿蒙端快速建立一条 AI 对话逻辑。

import'package:flutter/material.dart';import'package:dart_openai/dart_openai.dart';voidmain(){OpenAI.apiKey ="YOUR_KEY";// 此处替换真实 KeyrunApp(constMaterialApp(home:OpenAIQLab()));}classOpenAIQLabextendsStatefulWidget{constOpenAIQLab({super.key});@overrideState<OpenAIQLab>createState()=>_OpenAIQLabState();}class _OpenAIQLabState extendsState<OpenAIQLab>{String _answer ='问问我任何关于鸿蒙开发的问题吧!';void_askAi()async{setState(()=> _answer ='AI 正在深度思考中...');try{// ✅ 实战:单次完整对话请求final completion =awaitOpenAI.instance.chat.create( model:"gpt-3.5-turbo", messages:[OpenAIChatCompletionChoiceMessageModel( content:[OpenAIChatCompletionChoiceMessageContentItemModel.text("解释什么是鸿蒙系统")], role:OpenAIChatMessageRole.user,),],);setState(()=> _answer = completion.choices.first.message.content!.first.text!);}catch(e){setState(()=> _answer ='连接 AI 实验室失败:$e');}}@overrideWidgetbuild(BuildContext context){returnScaffold( appBar:AppBar(title:constText('dart_openai 鸿蒙实验室')), body:Center( child:Padding( padding:constEdgeInsets.all(16.0), child:Column( mainAxisAlignment:MainAxisAlignment.center, children:[constIcon(Icons.auto_awesome, size:80, color:Colors.teal),constSizedBox(height:20),Text(_answer, textAlign:TextAlign.center, style:constTextStyle(fontSize:16)),constSizedBox(height:30),ElevatedButton(onPressed: _askAi, child:constText('向 AI 提问')),],),),),);}}
在这里插入图片描述

六、总结

在鸿蒙生态万物合一的构想中,AI 是点亮智慧的关键火种。通过 dart_openai,我们将世界顶尖的推理算力带到了 Flutter for OpenHarmony 开发者面前。从极简的对话到复杂的创意生成,AI 的加入让鸿蒙应用不再仅仅是单纯的工具,而是懂人、助人的智慧伙伴。

核心要点回顾:

  1. 全协议覆盖:从 Chat 到 Image,拥抱 OpenAI 全场景能力。
  2. 鸿蒙代理支持:灵活的 Base URL 配置,满足复杂网络环境。
  3. 响应式体验:利用 Stream 机制实现丝滑的打字机交互。
  4. 安全合规:重视数据预处理,守护鸿蒙用户隐私。

让 AI 的灵魂,赋予您的鸿蒙应用无限的可能!

Read more

论文阅读“Vision-Language-Action (VLA) Models: Concepts, Progress, Applications and Challenges“

目录 * 一、**研究背景与动机** * 1.1 背景 * 1.2 动机 * 二、**VLA模型的核心概念** * 2.1 定义 * 2.2 三大发展阶段 * 三、**核心技术分析** * 3.1 多模态融合 * 3.2 统一Token化 * 3.3 学习策略 * 四、**代表性模型总结** * 五、**应用场景分析** * 5.1 人形机器人 * 5.2 自动驾驶 * 5.3 工业制造 * 5.4 医疗与农业 * 5.5 增强现实导航 * 六、**挑战与局限** * 七、

飞书机器人插件开发:让HunyuanOCR自动识别群聊图片

飞书机器人插件开发:让HunyuanOCR自动识别群聊图片 在企业协作越来越依赖即时通讯工具的今天,飞书早已不仅是聊天软件,而是组织内部信息流转、任务协同和知识沉淀的核心枢纽。然而一个长期被忽视的问题是:每天成千上万张在群聊中流转的图片——合同截图、发票照片、会议白板、产品原型图——它们所承载的关键信息,却像孤岛一样“沉睡”着。 这些图像无法被搜索、难以归档、更无法参与自动化流程。要提取其中的文字内容,往往还得靠人工逐字抄录。效率低不说,还容易出错。有没有可能让系统自己“看懂”这些图片? 答案是肯定的。随着多模态大模型的发展,OCR(光学字符识别)技术已经从传统的“检测+识别”两阶段流水线,进化为端到端的智能理解引擎。腾讯推出的 HunyuanOCR 正是这一趋势下的代表性成果:它基于混元大模型架构,仅用约10亿参数就实现了业界领先的识别精度,且支持复杂文档解析、字段抽取、多语言识别等全场景能力。 更重要的是,这款模型可以部署在单卡4090D上,意味着中小企业也能低成本拥有自己的“视觉大脑”。如果再将它接入飞书机器人,就能实现这样一个理想场景:用户上传一张发票截图,

教育场景落地:gpt-oss-20b-WEBUI实现自动答疑机器人

教育场景落地:gpt-oss-20b-WEBUI实现自动答疑机器人 教育行业正面临一个长期痛点:学生提问量大、时间分散、教师响应滞后,尤其在课后复习、自习答疑、在线学习等非教学时段,知识盲点无法及时消除。传统方式依赖人工值守或预设FAQ,覆盖有限、更新缓慢、缺乏交互深度。而gpt-oss-20b-WEBUI镜像的出现,为一线教育工作者提供了一种轻量、可控、可私有化部署的智能答疑解决方案——它不依赖云端API,不上传学生数据,模型运行在本地算力上,真正把“AI助教”装进了学校的IT基础设施里。 本文将聚焦真实教育场景,不讲抽象架构,不堆参数对比,而是带你从零开始:如何用一台双卡4090D服务器(或云上vGPU实例),快速部署gpt-oss-20b-WEBUI,构建一个能理解数理化题干、解析错因、分步讲解、支持多轮追问的自动答疑机器人。所有操作基于镜像内置能力,无需编译、不改代码、不配环境,重点落在“怎么用对”和“怎么用好”上。 1. 为什么是gpt-oss-20b-WEBUI?教育场景的三重适配 教育场景对AI答疑工具的要求很具体:不是越“全能”

【机器人】具身导航 VLN 最新论文汇总 | Vision-and-Language Navigation

【机器人】具身导航 VLN 最新论文汇总 | Vision-and-Language Navigation

本文汇总了具身导航的论文,供大家参考学习,涵盖2026、2025、2024、2023等 覆盖的会议和期刊:CVPR、IROS、ICRA、RSS、arXiv等等 论文和方法会持续更新的~ 一、🏠 中文标题版 2026 ✨ * [2026] SeqWalker:基于分层规划的时序视野视觉语言导航方法 [ 论文 ] [ GitHub ]   * [2026] UrbanNav:从网络规模人类轨迹中学习语言引导的城市导航方法 [ 论文 ] [ GitHub ]  * [2026] VLN-MME:面向语言引导视觉导航智能体的多模态大语言模型诊断基准 [ 论文 ] [ GitHub ]  * [2026] ASCENT: 实现楼层感知的零样本物体目标导航  [ 论文] [ GitHub ] 2025 😆 * [2025] ETP-R1:面向连续环境VLN的进化拓扑规划与强化微调方法 [ 论文 ] [ GitHub ] * [2025] NaviTrace:评估视觉语言模型在真实世界场景中的导航能力 [ 论文 ] [ GitHub ] * [2025]