【AI智能体】Dify 搭建发票识别助手操作实战详解

【AI智能体】Dify 搭建发票识别助手操作实战详解

目录

一、前言

二、Dify 概述

2.1 Dify是什么

2.2 Dify核心特性

2.2.1 Dify特点

2.2.2 多模型支持

2.3 传统发票识别技术与AI识别方案对比

2.3.1 传统发票识别技术方案

2.3.2 传统发票识别技术方案局限

2.3.3 基于Dify 搭建发票识别应用优势

三、Dify 搭建发票识别助手操作过程

3.1 前置操作说明

3.1.1 安装必要的插件

3.2 提取图片发票的内容

3.2.1 创建新应用

3.2.2 开始节点增加一个文件类型参数

3.2.3 增加一个文档提取器节点

3.2.4 增加大模型节点

3.2.5 配置回复结束节点

3.2.6 效果测试

3.3 提取PDF发票文件内容

3.3.1 安装PDF插件

3.3.2 增加PDF工具节点

3.3.3 调整大模型节点

3.3.4 效果测试

四、写在文末


一、前言

对传统业务系统或应用来说,实现一个新功能,从设计到最终开发完成,这个过程的耗时可能非常长。随着AI智能体在很多领域使用的越来越广泛,并逐渐产生商业价值之后。人们惊讶的发现,一个可以实现商用的业务系统或应用,只需短短几天,甚至几小时就可以做出来。这让人有理由相信,智能体已经强大到什么程度了,究竟智能体的潜力是不是没有上限呢?本篇以Dify为例,来搭建一个传统的应用系统中常用的功能,识别发票为例进行详细的说明。

二、Dify 概述

2.1 Dify是什么

Dify 是一个开源大模型应用开发平台,旨在帮助开发者快速构建、部署和管理基于大型语言模型(LLM)的 AI 应用。它提供了一套完整的工具链,支持从提示词工程(Prompt Engineering)到应用发布的全流程,适用于企业级 AI 解决方案和个人开发者项目。

官网入口:

Read more

爱普生SGPM01陀螺仪模块:赋能智能割草机与泳池清洁机器人精准导航

爱普生SGPM01陀螺仪模块:赋能智能割草机与泳池清洁机器人精准导航

随着智能设备在复杂场景中的广泛应用,惯性导航技术成为解决环境依赖问题的核心方案。泳池清洁机器人因水下环境无法使用激光或视觉导航,而无人割草机常因信号遮挡导致定位失效。针对这些挑战,南山电子代理的SGPM01是爱普生推出的一款陀螺仪模块,凭借其高精度、低功耗特性,成为两类设备导航系统的关键组件,助力行业迈向规划式智能时代。 SGPM01是基于高性能陀螺仪传感器和加速度计,磁力计开发的模组,内置3轴陀螺仪和3轴加速度计传感器和3轴地磁传感器。依赖于高精度的传感器、高性能的处理器和高级的数字信号处理算法,输出非常稳定的角速度值,加速度值,磁力计和姿态角。模块可以支持UART,SPI数据通讯,产品总体尺寸为24*22*8mm。 SGPM01产品特性: • 高精度9轴陀螺仪模组 • 输出三轴加速度值,三轴角速度值,三轴地磁,姿态角(Pitch,Roll,Yaw),温度 • 数字通讯接口UART和SPI • 产品尺寸:24*22*8mm • 低功耗 SGPM01在无人割草机中的应用: 对于海外家庭来说,无人自动割草机的出现有效解决了割草难题。然而,信号丢失导致路径混乱

RoboCerebra:用于长范围机器人操作评估的大规模基准测试

RoboCerebra:用于长范围机器人操作评估的大规模基准测试

25年10月来自北航、新加坡国立和上海交大的论文“RoboCerebra: A Large-scale Benchmark for Long-horizon Robotic Manipulation Evaluation”。 视觉-语言模型(VLM)的最新进展使得指令控制型机器人系统具备更强的泛化能力。然而,现有的大部分工作都集中于反应式的系统1策略,未能充分利用VLM在语义推理和长时程规划方面的优势。这些以深思熟虑、目标导向思维为特征的系统2能力,由于现有基准测试的时间尺度和结构复杂性的限制,仍未得到充分探索。为了弥补这一不足,RoboCerebra,用于评估长范围机器人操作中高级推理能力的基准测试。RoboCerebra包含:(1)一个大规模仿真数据集,该数据集在家庭环境中具有扩展的任务时域和多样化的子任务序列;(2)一个分层框架,该框架结合高级VLM规划器和低级视觉-语言-动作(VLA)控制器;以及(3)一个评估协议,该协议通过结构化的系统1-系统2交互来评估规划、反思和记忆能力。该数据集采用自顶向下的流程构建,其中 GPT 生成任务指令并将其分解为子任务序列。人类操作员在模拟

低代码AI化:是否正在重构开发行业格局?

低代码AI化:是否正在重构开发行业格局?

当低代码遇上AI,不再是简单的“拖拽+模板”拼凑,而是技术逻辑与业务场景的深度重构。JNPF依托AI能力,将表单、字段、咨询、流程四大核心环节智能化升级,让“不懂代码也能做开发”从噱头落地为现实。这是否意味着,低代码AI化正悄然颠覆整个开发行业的底层逻辑? 一、技术底层重构:从“工具拼接”到“原生智能”         传统低代码的核心局限,在于架构层面的“伪智能”。多数平台仅将AI作为附加插件,通过API调用实现表单生成、字段推荐等基础功能,本质上仍是“模板填充+关键词匹配”的逻辑,既无法深度适配个性化业务场景,也难以突破数据孤岛与功能壁垒。         而JNPF实现的是AI与低代码底层架构的深度耦合,以“原生智能”重构开发链路: * AI表单:摒弃传统模板套取模式,基于NLP语义解析技术,直接将自然语言描述转化为标准化表单。例如输入“客户售后工单系统:包含工单编号、客户信息、问题类型、处理进度、回访记录,支持状态流转与权限管控”

DIY无人机--升压降压电路

DIY无人机--升压降压电路

这是无人机的电源管理核心,把电池电压一步步变成系统需要的稳定电压,我分模块给你讲清楚 1. 整体功能 * 输入:锂电池(DC4.2V,满电电压,实际放电会到 3.7V 左右) * 输出: * 5V:给电机、无线模块等供电 * 3.3V:给 STM32、陀螺仪等精密芯片供电 * 流程:电池 → 防反接 → 开关 → 升压到 5V → 降压到 3.3V 逐模块拆解 🛡️ ① 防反接 + 电源开关部分 * JP2:电池接口,VBAT接电池正极,GND接负极 * D5(二极管 S4):防反接保护 * 原理:电池接反时,二极管截止,电流无法流通,保护后面电路不被烧毁 * 正常接法:电池正极