脉脉独家【AI创作者xAMA】|当豆包手机遭遇“全网封杀”:AI学会操作手机,我们的饭碗还保得住吗?

脉脉独家【AI创作者xAMA】|当豆包手机遭遇“全网封杀”:AI学会操作手机,我们的饭碗还保得住吗?
在这里插入图片描述

🔥草莓熊Lotso:个人主页
❄️个人专栏: 《C++知识分享》《Linux 入门到实践:零基础也能懂》
✨生活是默默的坚持,毅力是永久的享受!


🎬 博主简介:

在这里插入图片描述

在这里插入图片描述
【AI创作者xAMA】 在脉脉的匿名职言区,一条关于“字节跳动豆包手机功能被国产手机厂商集体封杀”的爆料,引发了技术圈和职场人的双重焦虑——AI已经开始学会“使用”手机了,这是否意味着一些岗位即将消失?

脉脉热榜上,一条关于“字节跳动豆包手机功能被华为、小米、OPPO、vivo等国产手机厂商在系统层面集体屏蔽”的讨论,在技术圈和职场人中炸开了锅。在#AI取代人类工作#的话题下,已经有超过500条跟帖讨论。

这条消息最早由一位认证为“某手机大厂高级工程师”的用户爆出,随后迅速得到多个信源的交叉证实。而最让职场人感到不安的,不是商业竞争本身,而是这项技术背后的意义——AI已经进化到能够直接操作图形界面完成复杂任务了。


01 职场危机,脉脉上技术人的真实焦虑

“刚看到这个消息,我整个人都不好了。”一位认证为“前端开发工程师”的脉脉用户在话题下写道,“我之前以为AI最多是辅助写代码,没想到现在已经能直接操作界面了。我们做的UI,在AI眼里可能只是一堆可点击的坐标。”

在这条评论下,有超过200个赞和43条回复。另一位用户悲观地补充道:“如果AI能通过图形界面完成所有操作,那需要人机交互设计师还有什么用?我们的工作不就是设计人类看得懂、会操作的界面吗?”

在脉脉的“职言”板块,关于AI取代工作岗位的讨论自去年ChatGPT发布后就从未停止,但这次GUI Agent技术的曝光,让许多过去认为“安全”的岗位也开始感到威胁。特别是那些与图形界面直接相关的职位:UI设计师、测试工程师、运营人员,甚至是一些基础的数据录入岗位。

一位互联网大厂的产品经理在匿名区坦言:“我们团队已经在内部测试类似的工具,一个AI可以模拟完成用户在我们App上的完整操作流程,从注册、浏览到下单。这意味着,未来可能不再需要那么多真人来做用户行为测试了。”

02 技术解读,脉脉大V如何分析这场博弈

针对这一技术趋势,脉脉上多位认证为“AI算法专家”、“计算机视觉研究员”的行业大V给出了专业解读。

“这其实标志着AI从‘对话智能’向‘操作智能’的进化。”一位在头部AI公司工作的技术专家写道,“过去的大语言模型只能理解和生成文本,而GUI Agent要解决的是更复杂的问题——如何将视觉信息转化为动作序列。”

另一位大V补充道:“训练一个GUI Agent最大的难点在于获取高质量的人机交互数据。字节跳动在这方面可能有天然优势,通过旗下各种App可以收集到海量的用户真实操作数据。这可能也是手机厂商感到紧张的原因之一——它们可能担心字节通过这些数据训练出的Agent会过于强大。”

在技术讨论中,多位专家都提到了一个关键概念:“强化学习”。GUI Agent需要通过不断试错来学习如何更好地完成任务,就像人类学习使用新软件一样。而一旦某个Agent在特定领域(比如电商购物或内容发布)达到足够高的效率,就可能对相关行业的就业结构产生冲击。

03 竞争真相,为什么是“集体封杀”?

脉脉上,关于各大手机厂商为何采取一致行动的讨论也异常激烈。一位自称“了解内情”的认证用户透露:“这不是简单的商业竞争问题,而是涉及到底层系统安全和数据隐私的考量。”

该用户进一步解释:“GUI Agent需要极高的系统权限——它要能‘看到’屏幕上的所有内容,并且能‘模拟’用户的点击和输入。这意味着,如果这个功能被滥用,可能会导致严重的隐私泄露甚至安全问题。”

另一个高赞评论从商业角度分析:“手机厂商的应用商店和系统服务都有成熟的商业模式。如果AI能绕过这些直接完成任务,就等于动了它们的蛋糕。比如,如果豆包的AI能直接在淘宝上完成购物,那手机厂商的应用商店分成、广告收入都可能受到影响。”

一位认证为“手机厂商战略分析师”的用户则从生态控制的角度提出了看法:“操作系统厂商最看重的是对生态的控制力。GUI Agent技术本质上是创造了一个‘元应用’,可以跨越不同App进行操作。这相当于在操作系统和应用层之间插入了一个新的层级,自然会引发平台方的警惕。”

04 职场未来,哪些岗位最危险?哪些相对安全?

在脉脉的众多讨论中,最受关注的话题莫过于:“我的工作会被取代吗?”

一位AI行业研究员在长文中分析:“从技术角度看,GUI Agent最先可能冲击的是那些流程化、重复性高的操作岗位。比如数据录入员、基础测试工程师、内容审核员、客服操作员等。这些工作的共同特点是操作界面相对固定,任务模式可预测。”

然而,同样有脉脉用户提出了不同观点:“AI能取代的是‘操作’,而不是‘决策’和‘创造’。比如,一个优秀的UI设计师,价值不在于他能熟练操作设计软件,而在于他的审美能力、用户心理把握和创新能力。这些是目前AI难以完全复制的。”

脉脉上多位人力资源专家也参与了讨论。一位认证为“互联网大厂HRD”的用户建议职场人:“面对AI技术的快速发展,最好的策略不是恐慌,而是了解、学习和适应。可以思考两个问题:第一,我的工作中哪些部分最可能被自动化;第二,如何提升那些AI难以替代的能力,比如复杂沟通、创造性思维和战略规划。”

05 脉脉观察,中国互联网人的集体心态变化

从ChatGPT到Midjourney,再到现在的GUI Agent,脉脉作为中国互联网从业者的聚集地,敏锐地记录了这波AI浪潮对职场人心态的影响。

与最初对AI技术的纯粹好奇和兴奋不同,最近几个月的讨论明显增加了更多焦虑和危机感。一位脉脉用户在话题下的评论获得了高共鸣:“以前觉得AI离替代我的工作还很远,现在突然觉得,可能就这三五年的事了。”

另一个值得注意的现象是,越来越多不同领域的职场人开始主动学习AI相关知识。脉脉上“AI技能”、“提示工程”、“机器学习入门”等相关话题的关注度和讨论量在过去半年增长了300%以上。

一位认证为“职业规划师”的脉脉大V总结道:“每次重大技术变革都会带来职业结构的调整,但同时也会创造新的机会。GUI Agent技术虽然可能替代一些现有岗位,但也会产生新的职业需求,比如AI训练师、人机协作设计师、自动化流程专家等。关键在于我们能否快速适应这种变化。”


🍓 我是草莓熊 Lotso!若这篇技术干货帮你打通了学习中的卡点: 👀 【关注】跟我一起深耕技术领域,从基础到进阶,见证每一次成长 ❤️ 【点赞】让优质内容被更多人看见,让知识传递更有力量 ⭐ 【收藏】把核心知识点、实战技巧存好,需要时直接查、随时用 💬 【评论】分享你的经验或疑问(比如曾踩过的技术坑?),一起交流避坑 🗳️ 【投票】用你的选择助力社区内容方向,告诉大家哪个技术点最该重点拆解 技术之路难免有困惑,但同行的人会让前进更有方向~愿我们都能在自己专注的领域里,一步步靠近心中的技术目标! 

结语:在脉脉的另一条高赞帖子中,一位用户提出了耐人寻味的问题:“如果AI连图形界面都能操作了,那下一步是不是就能直接控制物理世界了?”这个问题暂时无人能回答,但在各大公司的实验室里,具身智能(Embodied AI)的研究已经在进行中。

✨把这些内容吃透超牛的!放松下吧✨ʕ˘ᴥ˘ʔづきらど

Read more

Cosmos-Reason1-7B实战案例:工业巡检中识别设备异常动作的推理过程

Cosmos-Reason1-7B实战案例:工业巡检中识别设备异常动作的推理过程 1. 项目背景与模型介绍 Cosmos-Reason1-7B是NVIDIA开源的一款7B参数量的多模态视觉语言模型,专注于物理理解和思维链推理能力。作为Cosmos世界基础模型平台的核心组件,它能够处理图像和视频输入,并生成符合物理常识的决策回复。 在工业场景中,设备异常动作的识别一直是个挑战。传统方法需要大量规则编写和人工检查,而Cosmos-Reason1-7B通过其强大的视觉理解和推理能力,可以自动分析设备运行状态,识别异常动作并提供解释。 2. 工业巡检场景准备 2.1 数据采集要求 要使用Cosmos-Reason1-7B进行工业设备异常检测,需要准备以下数据: * 设备正常运行时的视频片段(作为基准参考) * 待检测的视频片段(可能包含异常动作) * 设备的基本信息(类型、预期动作等) 2.2 视频规格建议 为了获得最佳分析效果,建议视频满足以下条件: 参数推荐值说明分辨率720p或更高确保设备细节清晰可见帧率4-10 FPS与模型训练设置匹配时长10-30秒

OpenREALM:无人机实时映射框架的技术深度解析

OpenREALM:无人机实时映射框架的技术深度解析

在无人机应用日益广泛的当下,精准、高效的实时映射技术成为推动行业发展的关键。传统无人机映射方案往往存在数据处理滞后、对复杂地形适应性差等问题,难以满足精准农业、应急救援等场景的实时决策需求。OpenREALM 作为一款开源的无人机实时映射框架,创新性地融合了视觉 SLAM、单目稠密重建等前沿技术,实现了从 2D 图像拼接至 3D 表面重建的多模式映射功能。 原文链接:https://arxiv.org/pdf/2009.10492 代码链接:https://github.com/laxnpander/OpenREALM 沐小含持续分享前沿算法论文,欢迎关注... 一、引言:无人机映射技术的现状与挑战 1.1 应用背景与核心需求 人类对世界的勘测需求推动了映射技术的持续发展,而无人机的兴起为空中勘测提供了全新的解决方案。空中影像已广泛应用于精准农业、城市规划、灾害风险管理等关键领域,这些应用场景不仅对数据分辨率有较高要求,更在可用性、成本和映射效率方面提出了严苛标准。传统的有人机勘测存在操作复杂、成本高昂等局限,而无人机凭借轻量化设计、自主飞行能力强等优势,

零基础小白如何自学无人机开发

为零基础小白量身定制的无人机开发自学路径,规划了一条从入门到精通的系统性学习路线。这份指南会帮你避开新手常走的弯路,用最高效的方式掌握无人机开发的核心技能。 第一阶段:基础入门(1-2个月) - 打好根基 1. 理论学习 - 了解无人机如何工作 * 空气动力学基础:了解四旋翼无人机的基本飞行原理( pitch/roll/yaw ) * 硬件组成:学习飞控、电调、电机、GPS、IMU等核心部件的作用 * 推荐资源: * 书籍:《四旋翼飞行器设计与控制》 * 在线课程:Coursera的“Robotics: Aerial Robotics” * B站系列视频:“无人机原理入门” 2. 软件开发基础 - 掌握必要编程技能 * Python入门:语法基础、面向对象编程 * C++基础:指针、内存管理、类与对象(后续深入飞控开发必备) * Linux基本操作:Ubuntu系统安装、终端命令、