C++如何实现一个简单的AST(抽象语法树)_C++编译原理与抽象语法树实现

答案是使用C++通过继承和多态构建AST节点,定义ExprNode基类及NumberNode、BinaryOpNode等子类,形成树形结构并支持print遍历,结合智能指针管理内存,可扩展evaluate、变量节点等功能以实现完整表达式处理。

要实现一个简单的抽象语法树(AST),关键在于定义节点结构、构建树形关系,并支持遍历操作。C++因其对面向对象和多态的良好支持,非常适合用来实现AST。下面从基础出发,一步步说明如何手动构建一个简易的AST。

定义AST节点基类

AST中的每个节点代表源代码中的一个语法结构,比如数字、变量、加法表达式等。由于不同类型的节点具有不同的行为,使用继承和虚函数是合理的选择。

class ExprNode {
public:
    virtual ~ExprNode() = default;
    virtual void print() const = 0;
};

这里定义了一个纯虚基类 ExprNode,所有具体表达式节点都继承它。print 方法用于调试输出,实际应用中可能是 codegen 或 evaluate。

实现具体节点类型

常见的表达式包括常量、二元运算等。我们可以为每种类型创建子类。

class NumberNode : public ExprNode {
private:
    double value;
public:
    NumberNode(double v) : value(v) {}
    void print() const override {
        std::cout     }
};

class BinaryOpNode : public ExprNode {
private:
    std::string op;
    ExprNode left;
    ExprNode
right;
public:
    BinaryOpNode(const std::string& o, ExprNode l, ExprNode r)
        : op(o), left(l), right(r) {}
    void print() const override {
        std::cout         left->print();
        std::cout         right->print();
        std::cout     }
};

BinaryOpNode 表示如 a + b 这样的二元操作,持有左右子节点指针和操作符字符串。

构建AST示例

现在可以手动构造一个表达式,例如:(3.14 + 2.86) * 5

ExprNode* root = new BinaryOpNode(
    "*",
    new BinaryOpNode("+", new NumberNode(3.14), new NumberNode(2.86)),
    new NumberNode(5)
);
root->print(); // 输出: ((Number: 3.14 + Number: 2.86) * Number: 5)

这棵树结构清晰地反映了表达式的层级关系。真实编译器中,这些节点由词法分析和语法分析阶段自动生成。

内存管理与扩展建议

上述实现使用裸指针,存在内存泄漏风险。在实际项目中推荐:

  • 使用智能指针(如 std::unique_ptr)自动管理生命周期
  • 添加 evaluate 方法计算表达式值
  • 引入变量节点(VariableNode)和赋值语句支持
  • 结合递归下降解析器生成AST

例如改用 unique_ptr:

using ExprPtr = std::unique_ptr;

ExprPtr createNumber(double v) { return std::make_unique(v); }

基本上就这些。一个最小可用的AST核心就是定义节点、建立父子关系、提供访问接口。后续可对接符号表、类型检查或代码生成模块。不复杂但容易忽略细节,比如深拷贝和析构安全。