主页 > 知识库 > mongodb处理中文索引与查找字符串详解

mongodb处理中文索引与查找字符串详解

热门标签:地方门户网站 百度竞价排名 AI电销 Linux服务器 铁路电话系统 网站排名优化 呼叫中心市场需求 服务外包

参考文献

首先自打3.2版本之后,就开始支持中文索引了,支持的所有的语言参考这里:

https://docs.mongodb.com/manual/reference/text-search-languages/

然后,对于要支持索引的表需要建议text index,如何建立参考这里:

https://docs.mongodb.com/manual/core/index-text/

在建好索引text之后,如果检索参考:

https://docs.mongodb.com/manual/reference/operator/query/text/

实例

我有一个表,定义如下:

var ArticleSchema = new Schema({
 created: {
 type: Date,
 default: Date.now
 },
 title: {
 type: String,
 default: '',
 trim: true,
 required: 'Title cannot be blank'
 },
 abstract: {
 type: String,
 default: '',
 trim: true
 },
 abstractImg: {
 type: String,
 default: 'http://www.doocr.com/modules/core/client/img/brand/font-ocr.png',
 trim: true
 },
 content: {
 type: String,
 default: '',
 trim: true
 },
 category: {
 type: String,
 default: 'news',
 trim: true
 },
 user: {
 type: Schema.ObjectId,
 ref: 'User'
 },
 toPublish: {
 type: Boolean,
 default: true
 },
 comments: [CommentSchema]
 });

然后,里面有数据的,所以我直接检索,得到结果:

> db.articles.find( { $text: { $search: "coffee" } } )
Error: error: {
 "waitedMS" : NumberLong(0),
 "ok" : 0,
 "errmsg" : "text index required for $text query",
 "code" : 27
}

说明没有建议text索引,那么建一个:

db.articles.createIndex( {title: "text", content: "text" })

看看效果:

> db.articles.createIndex(
... {
... title: "text",
... content: "text"
... }
... )

下面是结果,成功了

{
 "createdCollectionAutomatically" : false,
 "numIndexesBefore" : 1,
 "numIndexesAfter" : 2,
 "ok" : 1
}

然后我开始检索:

> db.articles.find( { $text: { $search: "coffee" } } )

什么都没有。

我检索一个存在的中文:

> db.articles.find( { $text: { $search: "操作" } } )
{ "_id" : ObjectId("58b0eb5a136dc51b541eaf81"), "user" : ObjectId("589c8d22f7d9dc15989be255"), "comments" : [ ], "toPublish" : true, "category" : "blog", "content" : "p> /p>p>br/>/p>p>其实就是使用ubuntu 16的安装方式,参考网址:/p>p>a href=\"https://docs.mongodb.com/master/tutorial/install-mongodb-on-ubuntu/\" target=\"_blank\">https://docs.mongodb.com/master/tutorial/install-mongodb-on-ubuntu//a>/p>p>br/>/p>p>我的操作步骤:/p>pre>1.倒入key:sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv EA312927#10;/pre>p>br/>/p>p>2. 创建mongodb的软件源:/p>p>/etc/apt/sources.list.d/mongodb-org-3.2.list/p>p>操作:/p>pre>echo #34;deb http://repo.mongodb.org/apt/ubuntu xenial/mongodb-org/3.2 multiverse#34; | sudo tee /etc/apt/sources.list.d/mongodb-org-3.2.list#10;/pre>p>br/>/p>p>3. 更新系统:/p>p>sudo apt update/p>p>之后查看所有可以更新的软件:/p>p>sudo apt list --upgradable/p>p>然后升级所有软件:/p>p>sudo apt upgrade/p>p>br/>/p>p>4. 安装mongodb :/p>p>sudo apt install -y mongodb-org/p>p>也可以指定版本安装:/p>p>sudo apt-get install -y mongodb-org=3.2.8 mongodb-org-server=3.2.8 mongodb-org-shell=3.2.8 mongodb-org-mongos=3.2.8 mongodb-org-tools=3.2.8/p>p>不过我不使用这种方式。/p>p>br/>/p>p>5. 添加systemd 自启动条目:/p>p>sudo vim /lib/systemd/system/mongod.service/p>p>添加内容:/p>p>[Unit]/p>p>Description=High-performance, schema-free document-oriented database/p>p>After=network.target/p>p>Documentation=https://docs.mongodb.org/manual/p>p>br/>/p>p>[Service]/p>p>User=mongodb/p>p>Group=mongodb/p>p>ExecStart=/usr/bin/mongod --quiet --config /etc/mongod.conf/p>p>br/>/p>p>[Install]/p>p>WantedBy=multi-user.target/p>p>br/>/p>h2>6. 使能和启动服务:/h2>p>sudo systemctl enable mongod.service/p>p>sudo systemctl start mongod.service/p>p>br/>/p>h2>查看状态,一切ok。/h2>p>sudo systemctl status mongod.service/p>p>● mongod.service - High-performance, schema-free document-oriented database/p>p>Loaded: loaded (/lib/systemd/system/mongod.service; enabled; vendor preset: enabled)/p>p>Active: active (running) since Sun 2016-07-31 21:59:00 CST; 13min ago/p>p>Docs: https://docs.mongodb.org/manual/p>p>Main PID: 19374 (mongod)/p>p>CGroup: /system.slice/mongod.service/p>p>└─19374 /usr/bin/mongod --quiet --config /etc/mongod.conf/p>p>br/>/p>p>Jul 31 21:59:00 mint systemd[1]: Started High-performance, schema-free document-oriented database./p>p>br/>/p>p>7. 查看服务启动端口是否ok:/p>p>azuo1228@mint ~/webproj/mjs2/meanjs $ netstat -apn | grep mong/p>p>(Not all processes could be identified, non-owned process info/p>p>will not be shown, you would have to be root to see it all.)/p>p>unix 2 [ ACC ] STREAM LISTENING 76731 - /tmp/mongodb-27017.sock/p>p>br/>/p>p>br/>/p>", "abstractImg" : "http://www.doocr.com/modules/core/client/img/brand/font-ocr.png", "abstract" : "其实就是使用ubuntu 16的安装方式,参考网址:", "title" : "其实就是使用ubuntu 16的安装方式,参考网址:", "created" : ISODate("2017-02-25T02:26:34.483Z"), "__v" : 0 }
>

最后

但是这种检索都是不完美的,如果需要更好的支持,就需要参考:

https://docs.mongodb.com/manual/tutorial/text-search-with-rlp/

安装rlp支持mongodb检索中文,但是不是免费的。。。

所以,最好的方式就是使用Elastic Search同步mongodb,然后通过它检索,超出本文范围了,以后再说。

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对脚本之家的支持。

您可能感兴趣的文章:
  • MongoDB索引使用详解
  • MongoDB中唯一索引(Unique)的那些事
  • MongoDB的基础查询和索引操作方法总结
  • MongoDB中创建索引需要注意的事项
  • MongoDB性能篇之创建索引,组合索引,唯一索引,删除索引和explain执行计划
  • 深入理解MongoDB的复合索引
  • MongoDB查询字段没有创建索引导致的连接超时异常解案例分享
  • 关于MongoDB索引管理-索引的创建、查看、删除操作详解
  • MongoDB自动删除过期数据的方法(TTL索引)
  • 关于对MongoDB索引的一些简单理解

标签:黄山 兰州 仙桃 衡水 湘潭 崇左 湖南 铜川

巨人网络通讯声明:本文标题《mongodb处理中文索引与查找字符串详解》,本文关键词  ;如发现本文内容存在版权问题,烦请提供相关信息告之我们,我们将及时沟通与处理。本站内容系统采集于网络,涉及言论、版权与本站无关。
  • 相关文章
  • 收缩
    • 微信客服
    • 微信二维码
    • 电话咨询

    • 400-1100-266