v2ex 每天都有优秀的公司、企业发招聘贴由于招聘贴有效期至少是一星期以上,但很容易被新帖淹没,不如做个简单的招聘贴搜索站方便更多的人?
用结巴分词的语义功能做了个提取招聘贴标题内公司名、公司所在城市的小程序v2ex-job-finder:♥ Github
功能慢慢慢慢添加,现在还很 low 只能从标题提取有效信息... 有空闲时间一起捣鼓捣鼓的不?
提取关键词的例子(假装成功率很高):
str = u'#上海# [诺亚财富] 财富管理领域巨头-专注财富金字塔尖客户-低风险创业机会------互联网金融'
name, place_list = search_company_keyworks(str)
print name
for i in place_list:
print i
#<out>(正确)
#诺亚
#上海
str = u'[上海] 百度糯米团购 C 端_iOS 高级研发工程师'
name, place_list = search_company_keyworks(str)
print name
for i in place_list:
print i
#<out>(正确)
#百度
#上海
str = u'[北京] 魔力盒 app 招 iOS、Android 大拿( 15-30K)'
name, place_list = search_company_keyworks(str)
print name
for i in place_list:
print i
#<out>(错误)
#魔力
#北京
str = u'掌赢科技欢迎最棒的安卓 iOS~'
name, place_list = search_company_keyworks(str)
print name
for i in place_list:
print i
#<out>(正确)
#掌赢
#
str = u'[北京] [创业大街] 西游印(北京)科技有限公司后端开发(.NET)和前端开发招聘全职&实习生'
name, place_list = search_company_keyworks(str)
print name
for i in place_list:
print i
#<out>(正确)
#西游印
#北京
str = u'[北京招聘] 苹果公司! Apple Store 招聘 Specialist ,Family Room Specialist 等'
name, place_list = search_company_keyworks(str)
print name
for i in place_list:
print i
#<out>(正确)
#苹果公司
#北京
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.