VSCode Github Copilot使用OpenAI兼容的自定义模型方法

VSCode Github Copilot使用OpenAI兼容的自定义模型方法

背景

VSCode 1.105.0发布了,但是用户最期待的Copilot功能却没更新!!!
(Github Copilot Chat 中使用OpenAI兼容的自定义模型。)

在这里插入图片描述

🔥官方也关闭了Issue,并且做了回复,并表示未来也不会更新这个功能:
“实际上,这个功能在可预见的未来只面向内部人员开放,作为一种“高级”实验功能。是否实现特定模型提供者的功能,我们交由扩展作者自行决定。仅限内部人员使用可以让我们快速推进,并提供一种可能并非始终百分之百完善,但能够持续改进并快速修复 bug 的体验。如果这个功能对你很重要,我建议切换到内部版本 insider。”

在这里插入图片描述

🤗 官方解决方案:安装VSCode扩展支持

你们完全不用担心只需要在 VS Code 中安装扩展:OAI Compatible Provider for Copilot

在这里插入图片描述

通过任何兼容 OpenAI 的提供商驱动的 GitHub Copilot Chat,使用前沿开源大模型,如 Kimi K2、DeepSeek V3.2、GLM 4.6 等。

✨ 特色功能

  • 支持几乎所有与 OpenAI 兼容的供应商,例如 ModelScope、SiliconFlow、DeepSeek…
  • 支持视觉模型。
  • 为聊天请求提供额外的配置选项。
  • 支持同时配置来自多个供应商的模型,自动管理 API 密钥而无需反复切换。
  • 支持为同一模型 ID 定义多种配置(例如为 GLM-4.6 启用/禁用思考功能)。Supports almost all

支持控制模型在聊天界面中显示思考与推理内容。

thinkingPartDemo

⚡ 快速开始

  1. 安装“OAI Compatible Provider for Copilot”扩展。
  2. 打开 VS Code 设置,配置 oaicopilot.baseUrloaicopilot.models
  3. 打开 Github Copilot聊天界面。
  4. 点击模型选择器,选择“管理模型…”。
  5. 选择“OAI Compatible”提供商。
  6. 输入您的 API 密钥 —— 它将被本地保存。
  7. 选择您希望添加到模型选择器中的模型。

Settings Example

"oaicopilot.baseUrl":"https://api-inference.modelscope.cn/v1","oaicopilot.models":[{"id":"Qwen/Qwen3-Coder-480B-A35B-Instruct","owned_by":"modelscope","context_length":256000,"max_tokens":8192,"temperature":0,"top_p":1}]

Read more

AI数据标注平台的选型与实践:效率提升背后的技术逻辑

AI数据标注平台的选型与实践:效率提升背后的技术逻辑

👋 大家好,欢迎来到我的技术博客! 📚 在这里,我会分享学习笔记、实战经验与技术思考,力求用简单的方式讲清楚复杂的问题。 🎯 本文将围绕人工智能这个话题展开,希望能为你带来一些启发或实用的参考。 🌱 无论你是刚入门的新手,还是正在进阶的开发者,希望你都能有所收获! 文章目录 * AI数据标注平台的选型与实践:效率提升背后的技术逻辑 🚀 * 引言:为什么标注平台的选型决定了你与竞品的差距? * 第一部分:选型核心:超越表面的功能清单 * 1. 架构模式:SaaS vs. 私有化部署 ⚖️ * 2. 实时性与并发:WebSocket的魔法 ✨ * 3. 标注格式的“中间态”设计 🎨 * 第二部分:效率提升背后的技术架构 * 数据流转与任务分发架构 * 实战:构建一个智能预标注控制器 (Python示例) * 第三部分:不同数据类型的效率优化技术细节 * 1. 计算机视觉 (CV):交互方式的降维打击 * 2. 自然语言处理 (NLP):LLM如何改变标注剧本? * 第四

算力调度算法:基于AI的智能算力分配方法

算力调度算法:基于AI的智能算力分配方法

算力调度算法:基于AI的智能算力分配方法 📚 本章学习目标:深入理解基于AI的智能算力分配方法的核心概念与实践方法,掌握关键技术要点,了解实际应用场景与最佳实践。本文属于《云原生、云边端一体化与算力基建:AI时代基础设施革命教程》云原生技术进阶篇(第二阶段)。 在上一章,我们学习了"边缘节点节能技术:算力与功耗的平衡策略"。本章,我们将深入探讨基于AI的智能算力分配方法,这是云原生与AI基础设施学习中非常重要的一环。 一、核心概念与背景 1.1 什么是基于AI的智能算力分配方法 💡 基本定义: 基于AI的智能算力分配方法是云原生与AI基础设施领域的核心知识点之一。掌握这项技能对于提升云原生架构设计能力和AI应用落地效果至关重要。 # 云原生基础命令示例# Docker容器操作docker run -d--name myapp nginx:latest dockerpsdocker logs myapp # Kubernetes基础操作 kubectl get pods -n default kubectl describe pod myapp-pod kubectl

llama.cpp本地部署性能调优指南:从启动瓶颈到推理效率的全方位优化

llama.cpp本地部署性能调优指南:从启动瓶颈到推理效率的全方位优化 【免费下载链接】llama.cppPort of Facebook's LLaMA model in C/C++ 项目地址: https://gitcode.com/GitHub_Trending/ll/llama.cpp 在本地部署大语言模型时,你是否经常遇到启动缓慢、资源占用过高的问题?模型加载时间过长不仅影响开发效率,更会降低用户体验。本文将通过"问题诊断→核心原理→分级优化→场景适配"的框架,帮助你系统性解决llama.cpp的启动性能瓶颈,实现模型加载速度与资源占用的双重优化。我们将深入分析性能瓶颈的根本原因,提供分级优化策略,并针对不同使用场景给出定制化解决方案,让你的本地大模型部署既高效又稳定。 问题诊断:llama.cpp启动性能瓶颈分析 症状识别:常见性能问题表现 启动llama.

《LLaMA-Factory WebUI 快速上手:常见模型加载问题解决技巧》

LLaMA-Factory WebUI 快速上手:常见模型加载问题解决技巧 在人工智能领域,模型加载是使用大型语言模型的关键第一步。LLaMA-Factory作为一款开源工具,提供了直观的Web用户界面(WebUI),帮助用户轻松管理和部署模型。然而,许多新手在加载模型时遇到各种问题,导致效率低下或失败。本文将从快速上手开始,逐步介绍常见模型加载问题的解决技巧,确保您能顺利启动项目。文章基于实际经验原创撰写,内容实用可靠。 一、LLaMA-Factory WebUI 快速入门 LLaMA-Factory的WebUI设计简洁,适合初学者快速掌握。以下是最基本的操作步骤: 1. 模型加载流程:在WebUI中: * 选择“模型加载”选项卡。 * 输入模型名称或路径(如 llama-2-7b)。 * 点击“加载”按钮。系统会自动处理依赖和配置。 整个过程通常只需几分钟,界面会显示进度条和状态提示。 首次使用建议:为节省时间,优先加载小型模型(如 llama-2-7b),避免资源占用过大。加载成功后,您可立即测试推理功能: # 示例代码:简单文本生成