V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  macg0406  ›  全部回复第 2 页 / 共 2 页
回复总数  32
1  2  
2017-10-20 12:35:21 +08:00
回复了 scriptB0y 创建的主题 酷工作 如何成为一名爬虫工程师? (顺带招人)
@scriptB0y 可以像指定字体一样指定内容是否用自定义编码,如果希望被搜索到,就用正常编码,不希望被爬的,就用自定义编码。
2017-10-20 10:39:13 +08:00
回复了 scriptB0y 创建的主题 酷工作 如何成为一名爬虫工程师? (顺带招人)
做某块类似于爬虫工作时遇到自定义字形、自定义编码的问题,发现网页上面也可以,@font-face + WOFF,不遵循现有编码,也会给爬虫带来不小的麻烦。不过现在还没见到有人这样用。
2016-03-25 18:12:49 +08:00
回复了 macg0406 创建的主题 Elasticsearch 一行命令让 ElasticSearch 支持中文分词搜索
@Outshine 分词和词性标注都是免费的 =)
2016-03-25 15:07:11 +08:00
回复了 macg0406 创建的主题 Elasticsearch 一行命令让 ElasticSearch 支持中文分词搜索
@windfarer 你猜
2016-03-25 12:31:37 +08:00
回复了 macg0406 创建的主题 Elasticsearch 一行命令让 ElasticSearch 支持中文分词搜索
@cdmaok 正在准备中=)
2016-03-25 12:31:02 +08:00
回复了 macg0406 创建的主题 Elasticsearch 一行命令让 ElasticSearch 支持中文分词搜索
@unixbeta 是说只用点切分吗?比如 “这个.是什么.鬼”分为“这个”, “是什么”, “鬼” 吗
2015-11-10 10:21:41 +08:00
回复了 macg0406 创建的主题 机器学习 11 款开放中文分词引擎大比拼
@master 宣传一下我们自己的产品,让需要的人有更多的选择。之前我们的分词引擎只有 500 次 /天的调用额度限制,想要更多的就要收费了,但是现在我们把这个限制取消了,就是因为看到越来越多的人对中文分词的需求。以上这些领域的数据是我们经常需要处理的,相信也有其他人需要处理这样的数据。

至于说我们评出自己是同行最高分,大家也可以亲自试试,比较一下各家的表现如何。我们不否认我们有很多 bad case ,我们也不否认我们处理的速度慢。但是我们的分词引擎满足了我们其他引擎,以及数据处理任务的需求,希望也能为其他人提供帮助。

敝厂是初创型小公司,没有其他大厂有名气,希望大家多多关注和支持。
2015-11-09 17:48:45 +08:00
回复了 macg0406 创建的主题 机器学习 11 款开放中文分词引擎大比拼
乒乓球拍 /n 卖 /v 得 /ude 不错 /a
@imn1
2015-11-09 17:47:16 +08:00
回复了 macg0406 创建的主题 机器学习 11 款开放中文分词引擎大比拼
乒乓球拍 /n 卖 /v 得 /ude 不错 /a
2015-11-09 17:32:06 +08:00
回复了 macg0406 创建的主题 机器学习 11 款开放中文分词引擎大比拼
@leavic @zts1993 各有所长吧,满足需要就好。
2015-10-22 16:09:32 +08:00
回复了 macg0406 创建的主题 机器学习 BosonNLP 分词技术解密
Demo 请看: http://bosonnlp.com ,注册过后就可以免费无限次数调用分词和词性标注系统。
2015-08-31 15:52:16 +08:00
回复了 Gestalt 创建的主题 分享创造 BosonNLP 分词与词性标注 API 新版上线,全面免费开放
赞一个!
1  2  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4586 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 10:05 · PVG 18:05 · LAX 02:05 · JFK 05:05
Developed with CodeLauncher
♥ Do have faith in what you're doing.