首页
看点啥
插画图片
首页 经济看点 言知中文编程语言计划书 由 WorkBuddy

言知中文编程语言计划书 由 WorkBuddy

2026-06-17 0

言知(Yanzhi)项目规划书

 AI自动编程by WorkBuddy

言知中文编程语言计划书 by WorkBuddy

言知 · 心之所向,言即所行 从 zhixing (知行) 与 yanplan (言·计) 融合而来


一、项目概述

1.1 名称释义

言知(yán zhī)——"言"是表达,"知"是结构;说出的话就是有结构的知识。

字涵义对应编程言言语、表达、语法、句式自然意合语法、无空格分词、DSL 模板知知识、结构、类型、抽象AST、宏系统、类型检查器、引用求值

省略了一个"行"字——不是没有,而是不言而喻:言知即行。

1.2 项目定位

一门根植于汉语思维结构的中文编程语言,同时具备:

可读性——中文母语者可直接阅读和书写,无需"思维翻译"表达力——函数式核心 + 宏系统,不输 Lisp实用性——双轨设计(原生执行 + Python 生态调用)工程完备——类型检查、LSP、自举、包管理

1.3 血统与传承

zhixing (知行) yanplan (言·计)│ │├── 实现代码 ├── 语法设计规范├── 编译器/求值器 ├── 项目架构设计├── 标准库/LSP├── 言律句式规范├── 同像性/宏 ├── 自举实施方案└── 百家姓/中文数字└── 场景模板/成语模式│ │└───────────────┬───────────────────┘│┌───────▼───────┐│言知 ││yanzhi││││ 知为骨,言为表││ 行为脉,合为意│└───────────────┘


二、核心理念:三柱哲学

汲取前两轮头脑风暴的结论,言知的设计围绕三个哲学支柱展开:

2.1 知(Zhi)— 结构化计算

继承自 zhixing 的核心实现能力:

特性作用实现状态无空格分词贪心最长匹配,中文无需空格✅ 已有(pre_tokenizer.py)中文关键字定、函、若、则、遍历✅ 已有中文动词运算符加、减、乘、皆(map)、只(filter)✅ 已有柯里化参数不足自动生成闭包✅ 已有(Curry 类)同像性代码即数据,' 引用, 求值✅ 已有宏系统宏定义与展开✅ 已有(expander.py)类型检查类型推导✅ 已有(checker.py)标准库数学、字符串、文件、网络✅ 已有LSP语言服务器协议✅ 已有

2.2 言(Yan)— 自然意合表达

汲取自 yanplan/言律 的设计哲学:

特性说明优先级言律句式模板当...就... 要是...否则... 每隔...做...P1主题链补全省略主语/宾语的上下文推断P1流水句因果链"天黑了。没人。灯亮。" → 隐式 if 链P2成语式编程单元"削峰填谷""守株待兔"等结构化模板P2动词白名单领域专用动词语义映射P2作用域块语法"...的时候:" 定义局部作用域P1四字格模式利用汉语四字节奏增强结构记忆性P3

2.3 行(Xing)— 动态语义与生态

"言知即行"——说出来就是执行:

特性说明优先级管道  脉数据从左向右流动,中文逗号作链式操作符✅ 已有双轨设计$() 数学表达式 + {{}} Python 代码块✅ 已有VM/字节码独立虚拟机,不依赖 Python 运行时P1自举用言知编写言知的编译器P1(已有方案)包管理中文包名、语义版本P3REPL 增强语法高亮、历史回溯、补全P2

三、总体架构

3.1 寻址机制(言 → 知 → 行 互转流程)

用户输入:定平方=函x乘x x。言层无空格分词 → [定][平方][=][函][x][乘][x][x][。]知层语法分析 → Define(name="平方", value=Lambda(params=[x], body=Call(verb="乘", args=[Ident("x"), Ident("x")])))类型检查 → num → num行层求值执行 → 环境中创建函数 "平方"REPL 回显 → "平方定义完成"回到言层

3.2 双轨逃逸机制

$() 数学表达式:纯数学符号,精确计算$(a + b * (c - d)){{}} Python 代码块: 调用 Python 生态{{os.listdir(".")}}中文语句:自然语法,逻辑控制若 x 大 10 则 "大了" 否则 "小了"

三种语法在同一个源文件中可以自由混用,编译时自动识别上下文切换。


四、从 zhixing 到 yanzhi 的演化路径

阶段〇:遗产保留(不丢失任何现有功能)

言知完整继承 zhixing 所有已有能力:

模块当前文件处理方式预分词层compiler/pre_tokenizer.py保留 + 扩展中文句式识别词法分析compiler/lexer.py保留语法分析compiler/parser.py保留 + 新增言律句式规则ASTcompiler/ast.py保留 + 新增自然语句节点宏展开compiler/expander.py保留代码生成compiler/codegen.py保留求值器runtime/evaluator.py保留VM/字节码runtime/vm.py保留 + 优化REPLruntime/repl.py保留 + 增强类型检查typechecker/checker.py保留LSPlsp/server.py保留标准库stdlib/保留 + 扩展示例examples/保留 + 增加言律示例

阶段一:言律集成(P0 核心)

在 zhixing 基础上新增言律自然语言层的模块:

新模块功能依赖yan/syntax_templates.py句式模板解析(当→if,每隔→loop)pre_tokenizeryan/topic_chain.py主题链补全,省略主宾语的上下文恢复parseryan/scope_block.py"的时候:"作用域块解析parseryan/action_vocab.py动词白名单,高层语义映射evaluatoryan/dsl_factory.py宏工厂,把句式模板编译为宏定义expander

阶段二:VM 独立化(P1 性能)

当前:Python AST 求值器目标:独立字节码 VMzhixing vm.py ──扩展──→ yanzhi bc_vm.py │ ├── 指令集设计(24-36 条指令) ├── 寄存器/栈混合模型 ├── 字节码序列化/反序列化 └── GC(标记清除或引用计数)

阶段三:自举完成(P1 独立性)

沿用 yanplan 已有的自举方案:

阶段0:Python 编写的言知编译器(当前状态) ↓阶段1:用言知重写编译器核心(词法 + 语法 + AST) ↓阶段2:阶段0 编译 阶段1 → 获得言知编译器 ↓阶段3:言知编译器编译自身 → 自举完成 ↓验证:两轮编译输出一致

阶段四:生态建设(P2-P3)

包管理器(中文报名系统)IDE 插件(VS Code / 编辑器 LSP 增强)言律模板库("削峰填谷"等成语式编程模块)教学场景适配(面向儿童的言律 Lite)

五、语法设计汇总

5.1 保留的 zhixing 语法

zhixing

复制

# 定义定 x = 5。定 平方 = 函 n 乘 n n。# 条件若 x 大 10 则 "大" 否则 "小"。# 管道列 1 2 3 4 5,皆乘2,只大3,印。# 同像性定 code = '加 5 3。行 'code。# 宏宏 当(条件, 动作):行 '若 $(条件) 则 $(动作)

5.2 新增的言律自然语法

zhixing

复制

5.3 双轨语法

zhixing

复制

# 数学表达式定 x = $(a + b * (2 - c / d))# Python 代码块定 files = {{os.listdir(".")}}# 混合使用定 result = 列 $(range(10)),皆 {{lambda x: x * 2}},印。


六、项目目录结构


七、开发路线图(4 阶段 · 约 6 个月)

第一阶段:言律集成(第 1-2 月)

任务产出备注建立 yanzhi 项目结构目录树搭建,从 zhixing 迁移代码保留 git 历史言律句式模板引擎syntax_templates.py 实现 6 种句式当→if,每隔→loop 等主题链补全器topic_chain.py 实现上下文栈栈式记忆 + 最近引用作用域块解析scope_block.py 支持"的时候:"言律语法测试30+ 测试用例句式模板 + 主题链文档同步更新语法设计规范新增言律语法章节

验收标准:

✅ 以下代码可执行:

zhixing

复制

当 门开了,就开灯。每隔 5 分钟,查温度。回家的时候:灯亮。空调开。✅ 主题链可补全省略主语✅ 现有 zhixing 全部测试通过

第二阶段:VM 独立化(第 2-3.5 月)

任务产出备注指令集设计24-36 条指令,覆盖现有 AST 节点参考 Lua VM字节码编译器compiler_bc.py AST → 字节码VM 解释器vm.py 字节码执行引擎栈模型性能基准测试对比 AST 求值器与 VM目标 2-3x 提升GC 实现标记清除或引用计数

验收标准:

✅ AST 求值器与 VM 输出一致✅ VM 性能不低于 AST 求值器✅ 全部标准库可在 VM 上运行

第三阶段:自举(第 3.5-5 月)

任务产出备注编译器核心重写(言知)词法 + 语法 + AST自举阶段 1自举验证两轮编译一致性自举阶段 2-3性能优化内联缓存、常量折叠错误信息增强言知语言报错信息中文错误提示

验收标准:

✅ 言知编译器可编译自身源码✅ 两轮编译输出字节码一致✅ 自举后言知可脱离 Python 编译器独立运行

第四阶段:生态建设(第 5-6 月+)

任务产出优先级REPL 增强语法高亮、历史补全P2LSP 功能完善跳转定义、自动补全P2VS Code 插件语法高亮、代码片段P2言律模板库10+ 成语式编程模块P2包管理器原型yanzhi install 包名P3教学文档《言知入门》系列P3

八、关键设计决策(记录为未来参考)

8.1 言律句式的实现方式

决策:用宏实现,而非修改解析器。

理由:

宏在运行时定义,不需要修改编译器用户可自行扩展句式模板保持解析器简单、可验证

python

复制

# 宏的实现思路# 在 expander.py 中注册言律句式宏# 用户输入 "当 A 就 B" 时:# 1. pre_tokenizer 拆分为 [当][门开了][就][开灯]# 2. parser 识别为 Call(verb="当", args=[...])# 3. expander 展开宏当 →#Call(verb="若", args=[条件, Call(verb="则", args=[动作])])# 4. evaluator 正常求值

8.2 主题链补全策略

决策:栈式记忆 + 最近引用绑定 + 置信度阈值。

主题栈结构:[{"subject": "灯", "type": "device", "last_action": "打开"},{"subject": "温度", "type": "sensor", "last_value": 28}]省略解析:"调暗一点" → 扫描栈顶 → 匹配 "灯" → 灯.dim(30%)"高了" → 扫描栈顶 → 匹配 "温度" → 温度 > 阈值

8.3 双轨货币兑换策略

决策:编译时标记,运行时隔离。

$():编译为数学指令序列{{}}:编译为 Python C API 调用或进程间通信中文语句:编译为言知 VM 指令三种代码可互相调用,调用处做类型转换

8.4 自举优先级

决策:先自举语法分析部分,再逐步覆盖全部能力。

自举顺序:1. parser(核心递归下降算法)2. lexer(词法分析)3. pre_tokenizer(无空格分词)4. ast(节点定义)5. evaluator(简单求值)6. typechecker(可选)7. expander、codegen 等


九、风险与应对

风险概率影响应对策略自举中途无法通过自编译中高分模块逐步自举,每一模块自举后立即验证言律句式覆盖不够通用低中句式宏开放给用户自定义,不硬编码在编译器VM 性能不如预期中中保留 AST 求值器作为 fallback,VM 仅作为优化层主题链补全过于复杂中中限定上下文窗口大小为 3,复杂情况让用户显式指定Python 双轨引入安全风险低高{{}} 默认禁用,需要 --allow-python 标志启用

十、总结

言知不是一个"新语言"。它是在问:如果汉语母语者不需要"思维翻译"就能写程序——这个语言该怎么设计?

zhixing 用代码回答了"可以这样做"——它是 Lisp 的中文化身,证明了中文关键字 + 动词运算符 + 管道可以写出图灵机、Brainfuck 解释器、快速排序。

yanplan / 言律用设计回答了"应该这样做"——它是汉语自然语句的编程表达,证明了 "当_就_" "天黑了。灯亮了。" 可以被精确解析为计算逻辑。

言知把两者合在一起,用 zhixing 的宏系统承载言律的自然语法,用 zhixing 的同像性实现"言即知,知即行"。

定言知=函心'言'行。 (定义言知 = 把心里的"言"变成可执行的"行"。)

喜欢(0)

上一篇

WorkBuddy龙虾专家团实测:免费请5个AI专家并行干活:效率直接翻10倍!

WorkBuddy龙虾专家团实测:免费请5个AI专家并行干活:效率直接翻10倍!

下一篇

公司数据谁能看谁不能看?WorkBuddy的权限分级管理终于把这个问题讲清楚了

公司数据谁能看谁不能看?WorkBuddy的权限分级管理终于把这个问题讲清楚了
猜你喜欢