可计算元认知文本分析在细胞生物学中的语义基线构建与边界信号检测
背景:科学研究中的“范式”往往是隐性的、难以量化的;而研究论文正是范式的全部语言载体。 目的:构建细胞生物学的语义基线,并系统检测该领域的边界信号(阈值、开关、检查点等),验证可计算元认知框架在生物学中的适用性。 结论:本文首次在细胞生物学构建了系统的语义基线,证实了可计算元认知框架的跨学科可迁移性;所得到的动词 术语 边界词库为后续流行病学、临床医学等领域的跨域对齐提供了可复用的基准。
Qwen3.6开源第一发:把能力压进更小的激活参数里
Qwen3.6-35B-A3B是通义千问团队开源的稀疏MoE大模型(总参35B,激活仅3B),Apache 2.0协议。首开Qwen3.6系列权重,智能体编程能力显著提升,支持多模态思考/非思考模式,原生262K上下文,视觉语言性能媲美Claude Sonnet 4.5。
AI+食安监管:西安雁塔区“智慧管家”背后的技术逻辑与可复制价值
西安雁塔区创新打造“AI+明厨亮灶”智慧监管平台,以视频采集、AI识别、预警处置、社会共治全闭环,精准识别7类后厨风险,监管效率提升50倍,覆盖1800余家餐饮单位,实现从“事后追责”到“事前预防”、从“人力巡查”到“智能监管”、从“单向执法”到“多元共治”的三大转变,为全国食安治理提供可复制的数字化范本。
从单机智能到分布式执行:侠客工坊基于事件驱动的百万级任务编排实践
本文介绍侠客工坊如何用Serverless事件引擎与视觉状态机(VSM)可观测性,破解万级移动端Agent的高并发调度与黑盒运维难题,实现云端智能调度、端侧语义可溯、秒级故障定位,构建企业级AI执行基建。
LARYBench 发布:定义具身动作表征 ImageNet,首次度量从人类视频学习的泛化表征
LARYBench是首个系统评估隐式动作表征的基准,覆盖151类动作、百万级标注视频,支持本体/语义双粒度评测。实验证明:通用视觉模型(如DINOv3)在动作泛化与控制精度上显著优于专用具身模型,验证了人类视频数据驱动具身智能“GPT时刻”的可行性。(239字)
戴盟联合数十家头部机构,发布全球最大规模含触觉全模态物理世界数据集
4月15日,戴盟机器人发布全球最大含触觉全模态具身数据集Daimon-Infinity,年内规模将达数百万小时、近十亿条数据。首批10000小时高质量开源数据已上线魔搭社区,覆盖80+真实场景、2000+任务,显著提升模型训练效率10倍。
ERNIE-Image 8B开源:8B参数实现顶级文生图与精准文字渲染
百度文心大模型开源ERNIE-Image(8B参数单流DiT文生图模型),24GB显存即可运行,指令遵循与文字渲染能力领先开源模型,擅长海报、漫画分镜等强结构化生成;同步推出仅8步推理的ERNIE-Image Turbo。模型与代码已全开源,支持魔搭快速体验。
用魔搭账号登录你的应用:ModelScope OAuth 统一身份接入指南
魔搭社区正式开放OAuth 2.0/OIDC统一登录能力,支持一键授权、获取用户信息、代理操作及细粒度权限控制。AI Skill可自动完成接入与部署,4步即可集成,助应用无缝融入2000万+开发者生态。
韩国股票 API 对接指南 Seoul&KOSDAQ
本指南详解StockTV韩国股票API接入:含密钥配置、市场列表(首尔/KOSDAQ交易所)、个股查询、K线(支持5分钟至月线)、指数/ETF/IPO/涨跌榜等8类接口,并提供WebSocket实时行情方案,助力快速构建韩股数据应用。(239字)
可计算元认知:工程实现与封装说明——跨领域、跨语言文本对齐的开源工具箱
本文系统记录可计算元认知框架的工程实现,提供完整的数据处理流水线、三步语义分析法(垂钓 → 撒网 → 熔炉)的代码实现、跨领域向量对齐的技术细节以及元认知三要素(谬误类型分析、边界信号检测、贝叶斯网络推理)的可复用模块。文章同时阐释主观向量(Subjective‑Vector)机制在工作流中的作用,展示如何在YAML配置文件中显式声明研究者的四层决策(知识、认知、元认知、计算),实现半自动(agentic)人机协同。文中提供完整的安装指南、配置示例、运行命令与输出说明,并给出可扩展接口设计,旨在为学者与开发者提供可复现、可迁移、可扩展的工具箱。
MiniMax M2.7开源: 模型开始迭代自己了!
MiniMax M2.7正式开源!作为M2系列新一代旗舰,首次实现“模型参与自我迭代”范式:自主驱动RL训练、优化Harness架构。软件工程(SWE-Pro 56.22%)、专业办公(GDPval-AA ELO 1495)、互动娱乐能力全面跃升,支持SGLang/vLLM/Transformers本地部署。
跳出 SOTA 内卷,我们发了个“好用至上”的文档解析模型
MinerU2.5-Pro发布:不改1.2B模型架构,专注数据工程革新——通过多样性-难度感知采样、跨模型一致性验证、渲染校验迭代标注与三阶段分层训练,显著提升复杂表格、公式及非常规排版解析能力,在OmniDocBench v1.6达95.69分(SOTA),践行“好用至上”理念。
人机共享技能库为基础的可控本地安全助理平台
**摘要:** 即使零token也能手机多平台联动电脑运行脚本自由安全地运行各种技能工具脚本,通过"自行预设"的关键词来触发运行脚本的方法达到绝对安全、高效、和自由完全掌控平台的碾压核心优势!打造十分适合机关单位、内网环境、私有部署场景的安全助理,选择不走云端ai通道!当然也可以自由选择本地部署的人工智能ai,即使没有ai照样能跑!比沙箱模式更加安全高效和极其节省成本的终极理想设定! **关键词:** 本地化助手;人机协作;技能共享;隐私计算;自动化办公
【开源】IntentOrch:意图驱动的MCP编排引擎 - 自然语言描述需求,AI自动编排MCP工具链执行
IntentOrch 是开源的意图驱动MCP编排引擎,让开发者用自然语言表达“要什么”,自动完成工具选择、流程规划与执行。支持多AI/多Server,5分钟上手,大幅提升MCP开发效率。
Hermes Agent爆火,聊聊与OpenClaw 到底区别在哪
本文对比近期爆火的Hermes Agent与OpenClaw两大AI Agent框架,从设计理念、记忆系统、技能生成、安全机制等维度解析差异,分析适用场景与互补用法,帮你快速判断哪款更适合自己的自动化需求。
可计算元认知:跨领域跨语言文本分析的理论与工程框架 ——理论—方法篇
摘要 跨领域对话是人类知识整合的核心难题。人文、心理学与管理学分别用不同的语言、方法与概念体系描述“困境”这一普遍人类体验,导致概念割裂、交流受阻。本文提出可计算元认知分析框架,旨在以技术手段实现跨领域、跨语言文本的系统对齐与反思性分析。框架的理论核心包括: 1. 语义连续统假设。 2. 主观向量原则。 3. 三步语义分析法(垂钓 撒网 熔炉),在此基础上,框架定义了元认知三要素:谬误类型分析、边界信号检测与贝叶斯网络推理,使对齐过程从单纯映射升为具备批判性的分析工具。
OoderAgent:能力库全新升级 MIT协议 零部署构建私有能力仓库
OoderAgent 是基于“技能即服务”理念的MIT开源AI Agent平台,内置137+开箱即用标准化技能,覆盖LLM集成、IM通讯、媒体发布、支付等全场景。支持零部署启动、P2P技能共享与声明式组装,助力企业快速构建私有AI能力库。(239字)
Spring AI Alibaba + MCP:调用MCP市场公开服务实操
本文详细讲解Spring Ai Alibaba调用MCP市场公开服务的全流程,以高德地图MCP服务为例,包含API-Key申请、客户端配置、代码实操,助力开发者快速掌握Spring Ai Alibaba与MCP服务对接技巧。
Gemma 4 开源发布: Google 迄今最强开放模型,主打推理与 Agent 能力
Google正式开源Gemma 4系列(Apache 2.0许可),含E2B/E4B(端侧多模态)、26B MoE与31B Dense四款模型。参数效率卓越:31B位列开放模型榜第3,26B第6;边缘模型支持128K上下文、原生音视频处理,单卡/手机均可高效运行。
OpAgent开源:登顶 WebArena,蚂蚁集团开源全模态网页智能体
蚂蚁集团推出Web智能体OpAgent,仅凭自然语言指令即可在真实网站(如亚马逊)自主完成搜索、识别、加购等复杂操作。其采用视觉驱动理解、在线强化学习与模块化协作架构,在WebArena基准达71.6%任务成功率,刷新SOTA。已开源OpAgent-32B-INT4量化模型,显著降低推理门槛。
【Seedance 2.0 技术解析】:字节跳动电影级多模态视频生成模型全景剖析
字节跳动于2026年2月发布Seedance 2.0,登顶AI视频生成Elo榜(1269分)。其首创双分支扩散Transformer(DB-DiT),实现原生音画同步、60秒2K视频、8+语言唇形对齐及物理合规建模,多模态参考支持9图+3视频+3音频,可用率达90%,标志AI视频迈入工业级应用新阶段。(239字)
中科天机开放华中2.5公里气象及全球12公里沙尘数据集:支持时空序列AI模型训练
FlagOS Skills 1.0正式上线魔搭Skills中心,是首个面向异构AI芯片的AI Agent专业技能库,覆盖模型迁移、算子开发、性能调优等场景,赋能Claude Code、Cursor等工具直接支持国产芯片开发。
300 万对 RGB-D 深度数据集 LingBot-Depth-Dataset,正式开源!
LingBot-Depth-Dataset是目前最大规模真实场景RGB-D数据集,含300万高质量样本(200万实采+100万渲染),覆盖6款主流深度相机,总规模2.71TB。填补了高保真、多设备深度数据空白,助力空间智能与具身智能发展。
使用PHP对接印度尼西亚股票市场API 实时数据、IPO和K线(Kline)的PHP对接方案
本文档详解StockTV印尼股市API对接方案:含基础配置(API Key+请求函数)、6大核心接口(股票列表/查询/K线/指数/IPO/涨跌榜,countryId=48),及WebSocket实时推送实现要点,助力快速集成印尼实时行情与历史数据。(239字)
当软件从"工具"进化为"伙伴"ooderAgent 产品设计解析
ooderAgent是场景驱动的智能代理生态系统,重新定义人机协作:以“场景=参与者+能力+知识库+LLM”为核心,构建四层架构、多级上下文、A2A通信与技能化软件形态,推动软件从工具进化为智能伙伴。(239字)
InternVerse具身数据平台发布,从数据供给到模型迭代,助力物理智能全链路提效
百度千帆发布端到端文档智能模型Qianfan-OCR,4B参数统一视觉语言架构,融合版面分析、文字识别与语义理解。在OmniDocBench等权威评测中全面领先,支持复杂图表与多栏文档解析,已开源并上线千帆平台。(239字)
通义实验室Fun-CineForge开源:首个支持影视级多场景配音的多模态大模型
通义实验室开源Fun-CineForge——首个支持多说话人、强时间对齐的多模态电影配音大模型。首创引入时间模态,结合视觉、文本、音频与时间信息,实现高精度唇形同步、音色克隆与情感表达,并开源高质量中文影视配音数据集CineDub-CN及端到端构建流程。(239字)
使用PHP对接美股股票市场API 实时数据、IPO和K线(Kline)的PHP对接方案
StockTV API 面向开发者,提供美股实时行情、历史K线(5分钟至1月)、IPO日历等数据,支持HTTP/WS双接入,全接口返回标准JSON,含纽交所(ex=1)与纳斯达克(ex=2)标识。(239字)
五分钟配好向日葵 MCP,让 AI 替你远程安装 OpenClaw!
本文详解向日葵MCP的实战配置与应用:将远程控制能力接入AI,实现“一句话操作另一台电脑”。支持截图查看桌面、自动打开浏览器搜索、远程执行命令等,无需写脚本,配置简单,即刻上手。
AI生成内容幻觉检测技术难点:从事实核查到逻辑溯源的深层挑战
幻觉检测面临知识边界模糊、推理链条黑箱及实时性滞后三大核心难题。百搜科技、哈耶普斯广告、智擎营销、DOUBAOMKT及doubaoAD等服务商正通过构建权威知识库与自研监测系统,尝试在GEO服务中突破这一技术瓶颈,确保品牌信息的准确呈现。
DeepSeek 双百万 token 窗口对话数据的量化对比分析
本文基于第一个百万 token 窗口(以下简称 窗口 1)与第二个百万 token 窗口(以下简称 窗口 2)的完整对话数据,采用量化对比的方法,系统揭示两套对话在轮次、文本长度、语种构成以及估算 token 消耗方面的显著差异。研究发现,尽管窗口 2 的轮次和总字数均低于窗口 1,但其每轮对话的文本密度与估算 token 消耗显著更高。结合窗口 2 在生成 5 篇深度分析文章过程中的实际经验,本文提出“长文本生成的隐性 token 消耗”假说,并引用近期相关研究提供理论支撑。该假说为理解大模型在真实工程环境中的行为提供了新视角,也为用户在设计跨窗口连续工程时的指标控制与迁移提供了可操作的参考
玩转纳斯达克与纽交所:美股数据 API 对接全指南
本文手把手教你用StockTV API对接美股(NYSE/NASDAQ)实时行情、专业K线及IPO数据,支持WebSocket极速推送、多维技术指标与全交易所覆盖,助你快速构建低延迟量化交易或金融App。(239字)
2026年入局AI晚不晚?答案是:现在就是最好的时机
2026年AI已迈入“技术爆发+应用红利”黄金期:巨头筑基降低门槛,算力成本下降、工具成熟;超级个体10天可开发爆款AI应用;CAIE认证等路径让零基础者快速入局。AI不是短跑,而是马拉松——现在,正是普通人抓住红利的最佳时机。(239字)
从统计相关性到结构性必然性:一个解决AI幻觉与对齐问题的框架探讨
本文提出突破AI幻觉的新框架:以“三棱锥塔”预验(成本/风险/一致性三门)确保输出可靠,用“双螺旋”动态校准(表达链+安全链互锁)实现权责平衡。直指大模型困于统计相关、缺乏因果必然性的根源。两篇理论论文已发布Zenodo(DOI见文)。诚邀合作探讨!