编程语言标识符一般的原则都差不多,一般都是字母、数字和下划线的组合,具体为:
- 定义标准的标识符按字母、下划线开头,后面跟字母、数字和下划线
- C系语言/Shell都遵循
- 不能以数字开头
- 和整数和浮点数字面量冲突
- 不能含有其他字符
- 其他特殊字符,比如+-*/会和运算符冲突
- 下划线开头(包括双下划线)可能是语言保留字,谨慎使用
- 最大长度各有不同
- 早期编程语言会有限定有效标识符的限制,随着计算机内存空间飞速发展,此限制也逐渐放宽,新编程语言似乎对此无感,但事实上,内部依然有最大支持的长度以避免编译行为异常
- 过长的标识符长度给编译速度造成压力
- 大小写敏感随语言规定
- 大部分编程语言大小写敏感,这里仅仅分析不区分大小写的语言。例如:FORTRAN早期版本、Ada、Pascal、Basic、SQL和批处理脚本(与DOS/Windows文件路径不区分有关)。
TOKEN
标识符只是TOKEN的一种,TOKEN是编译器词法分析中最小单位。包括关键字、运算符、结束符、注释符等都是TOKEN的一种,词法分析分割出TOKEN最终送给语法分析处理。
BNF范式
ALGOL60首创提出BNF范式,上下文无关、支持递归的语法规则表达,极佳地支持编程语言完整性。
微风不燥,阳光正好,你就像风一样经过这里,愿你停留的片刻温暖舒心。
我是程序员小迷(致力于C、C++、Java、Kotlin、Android、iOS、Shell、JavaScript、TypeScript、Python等编程技术的技巧经验分享),若作品对您有帮助,请关注、分享、点赞、收藏、在看、喜欢,您的支持是我们为您提供帮助的最大动力。
欢迎关注。助您在编程路上越走越好!