简单的文件查询

C++ Primer 中的textquery例子

要求

  1. 从文本读取数据并构建查询表
  2. 返回查询结果
  3. 分析查询操作
  4. 支持操作与或非运算

interface

  1. TextQuery
  2. QueryResult
  3. Query: 保存需要的执行的操作
    1. 支持从字符串建立单词查询
    2. 支持 & | ~ 操作符

实现

TextQuery 和 QueryResult

查询结果需要输出行号和该行内容. 可以建立单词与行号集合的查询表.

std::map<std::string, std::set<line_no>> searchTable;

使用vector保存每行内容.
因为这些内容在查询结果中也要使用, 可以使用智能指针方便内容共享
结果中需要有行号集合的指针. 为了输出需要每行内容的指针

// 声明文件
 class QueryResult;
class TextQuery{
    using line_no = std::vector<std::string>::size_type;
public:
    TextQuery() = default;
    TextQuery(std::ifstream&);
    QueryResult query(const std::string&) const;
private:
    std::shared_ptr<std::vector<std::string>> textContent;
    std::map<std::string, std::shared_ptr<std::set<line_no>>> searchTable;
};

class QueryResult{
public:
    using line_no = TextQuery::line_no;
    using iterator = std::set<line_no>::iterator;
    QueryResult(const std::string& _query, 
                std::shared_ptr<std::vector<std::string>> _content, 
                std::shared_ptr<std::set<line_no>> _result = std::make_shared<std::set<line_no>>())
        : query(_query)
        , content(_content)
        , result(_result)
        {}
    std::set<line_no>::iterator begin() { return result->begin(); }
    std::set<line_no>::iterator end() { return result->end(); }
    std::shared_ptr<std::vector<std::string>> get_content(){return content;}
    friend std::ostream& operator<<(std::ostream&, const QueryResult&);
private:
    const std::string query;
    std::shared_ptr<std::vector<std::string>> content;
    std::shared_ptr<std::set<line_no>> result;
};

函数实现

TextQuery::TextQuery(istream& in)
{
    string line;
    while (getline(in, line))
    {
        textContent->emplace_back(line);
        istringstream ss(line);
        string word;
        line_no n = textContent->size() - 1;
        while (ss >> word)
        {
            auto p = searchTable[word];
            if (!p) p.reset(new set<line_no>);
            p->insert(n);
        }
    }
}

QueryResult TextQuery::query(const string& sought) const
{
    auto res = searchTable.find(sought);
    if (res == searchTable.end()) return QueryResult(sought, textContent);
    return QueryResult(sought, textContent, res->second);
}
ostream& operator<<(ostream& os, const QueryResult& res)
{
    os << res.query << " occurs " << res.result->size() << (res.result->size() > 1 ? "times" : "time") << endl;
    for (auto l : *res.result) os << "\t(line " << l + 1 << (*res.content)[l] << ")" << endl;
    return os;
}

Query

因为要支持与, 或, 非(&, |, ~)运算. 每种查询执行的操作不同, 定义一个抽象基类. 有两个纯虚函数 rep() 返回该查询操作的字符串描述. eval() 执行查询


derived.png

QueryBase

class QueryBase{
    friend class Query;
protected:
     virtual ~QueryBase() = default;

private:
    virtual QueryResult eval(const TextQuery&) const = 0;
    virtual std::string rep() const = 0;
};

// Query

class Query{
    friend Query operator&(const Query&, const Query&);
    friend Query operator|(const Query&, const Query&);
    friend Query operator~(const Query&);
public:
    Query(const std::string&);
    QueryResult eval(const TextQuery& t){return q->eval(t);}
    std::string rep(){return q->rep();}
private:
    std::shared_ptr<QueryBase> q;
    Query(std::shared_ptr<QueryBase> _q):q(_q){}
};

WordQuery


class WordQuery:public QueryBase{
    friend class Query;
    WordQuery(const std::string& s):word(s){}
    QueryResult eval(const TextQuery& t) { return t.query(word);}
    std::string rep() {return word;}
    std::string word;
};

Query::Query(const string& w):q(new WordQuery(w)){}

NotQuery 和 ~操作

class NotQuery : public QueryBase {
    friend Query operator~(const Query&);
    NotQuery(const Query& q) : query(q) {}
    QueryResult eval(const TextQuery&) const;
    std::string rep() const
    {
        return "~(" + query.rep() + ")";
    }
    Query query;
};


inline Query operator&(const Query&lhs, const Query& rhs)
{
    return shared_ptr<QueryBase>(new AndQuery(lhs, rhs));
}

BinartQuery

class BinaryQuery : public QueryBase {
protected:
    BinaryQuery(const Query& _lhs, const Query& _rhs, std::string _op) : lhs(_lhs), rhs(_rhs), op(_op) {}
    std::string rep() const override
    {
        return "(" + lhs.rep() + " " + op + " " + rhs.rep() + ")";
    }
    Query lhs, rhs;
    std::string op;
};

AndQuery 和 OrQuery


class AndQuery : public BinaryQuery {
    friend Query operator&(const Query& lhs, const Query& rhs);
    AndQuery(const Query& lhs, const Query& rhs) : BinaryQuery(lhs, rhs, "&") {}
    QueryResult eval(const TextQuery&) const;
};

class OrQuery : public BinaryQuery {
    friend Query operator|(const Query& lhs, const Query& rhs);
    OrQuery(const Query& lhs, const Query& rhs) : BinaryQuery(lhs, rhs, "|") {}
    QueryResult eval(const TextQuery&) const;
};


inline Query operator&(const Query&lhs, const Query& rhs)
{
    return shared_ptr<QueryBase>(new AndQuery(lhs, rhs));
}
inline Query operator|(const Query&lhs, const Query& rhs)
{
    return shared_ptr<QueryBase>(new OrQuery(lhs, rhs));
}

核心 eval 实现


QueryResult OrQuery::eval(const TextQuery& t) const
{
    auto left  = lhs.eval(t);
    auto right = rhs.eval(t);
    auto res   = make_shared<set<line_no>>(left.begin(), left.end());
    res->insert(right.begin(), right.end());
    return QueryResult(rep(), left.get_content(), res);
}

QueryResult AndQuery::eval(const TextQuery& t) const
{
    auto left  = lhs.eval(t);
    auto right = rhs.eval(t);
    auto res   = make_shared<set<line_no>>();
    set_intersection(left.begin(), left.end(), right.begin(), right.end(), inserter(*res, res->begin()));
    return QueryResult(rep(), left.get_content(), res);
}


QueryResult OrQuery::eval(const TextQuery& t) const
{
    auto left  = lhs.eval(t);
    auto right = rhs.eval(t);
    auto res   = make_shared<set<line_no>>(left.begin(), left.end());
    res->insert(right.begin(), right.end());
    return QueryResult(rep(), left.get_content(), res);
}

QueryResult AndQuery::eval(const TextQuery& t) const
{
    auto left  = lhs.eval(t);
    auto right = rhs.eval(t);
    auto res   = make_shared<set<line_no>>();
    set_intersection(left.begin(), left.end(), right.begin(), right.end(), inserter(*res, res->begin()));
    return QueryResult(rep(), left.get_content(), res);
}

命令分析

为了简便有一些限制

  1. 不能有空格
  2. 没有转义字符. 无法搜索包含 &|~的单词
  3. 表达式错误, 程序会崩溃.
Query parseQuery(const string& com)
{
    static map<char, int> opPriority{{')', 0}, {'|', 1}, {'&', 2}, {'~', 3}, {'(', 4}};
    stack<char> stOp;
    stack<Query> stQuery;
    string::const_iterator cur = com.begin();
    string::const_iterator end = com.end();
    while (cur != end)
    {
        if (opPriority.count(*cur))
        {
            while (!stOp.empty() && opPriority[*cur] <= opPriority[stOp.top()])
            {
                char op = stOp.top();
                stOp.pop();
                switch (op)
                {
                case '~': {
                    Query q = stQuery.top();
                    stQuery.pop();
                    stQuery.push(~q);
                    break;
                }
                case '&': {
                    Query r = stQuery.top();
                    stQuery.pop();
                    Query l = stQuery.top();
                    stQuery.pop();
                    stQuery.push(l & r);
                    break;
                }
                case '|': {
                    Query r = stQuery.top();
                    stQuery.pop();
                    Query l = stQuery.top();
                    stQuery.pop();
                    stQuery.push(l | r);
                }
                default: break;
                }
            }
            if (*cur == '(')
                stOp.push(')');
            else if (*cur != ')')
                stOp.push(*cur);
            ++cur;
        }
        else
        {
            string::const_iterator temp = cur;
            while (cur != end && !opPriority.count(*cur)) ++cur;
            stQuery.emplace(string(temp, cur));
        }
    }
    return stQuery.top();
}
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,524评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,869评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,813评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,210评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,085评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,117评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,533评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,219评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,487评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,582评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,362评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,218评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,589评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,899评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,176评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,503评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,707评论 2 335