个人关键字抽取,都来贴一下自己的关键字

2012-04-01 13:39:04 +08:00
 laiwei
http://thepast.me 加了一个小小的,有意思的功能,根据你的timeline,抽取个人的关键字。

登录后,访问自己的首页 http://thepast.me/i 可以看自己的关键字
登录后,访问其他人的页面 http://thepast.me/user/xxxx 可以看别人的关键字

enjoy!

我的关键字:

豆瓣 google android 推荐 电影 微博 douban twitter 照片 galaxy iphone 技术 百度 facebook 小组 中国 产品 youtube 设计 系统 cnbeta ipad 北京 上线 应用 美国 日记 web 阅读 创业


都来亮一下自己的关键字吧,哈哈

ps:关键字每24小时,重新计算一次。另外,现在的关键字个性化内容的提取不太理想。
4766 次点击
所在节点    分享创造
30 条回复
Link
2012-04-01 13:44:14 +08:00
专辑 电影 分享 照片 推荐 微博 豆瓣 love 虾米 成都 blog 字幕 twitter 森林 flickr 宅 游戏 中国 视频 兴趣 纪录片 熬夜 快乐 美国 故事 梦 第一次 安全 中文 吐槽
------
只关联了豆瓣.那个"第一次"...无力吐槽.=w=
laiwei
2012-04-01 13:46:07 +08:00
@Link 第一次 很有深意啊,哈哈
laiwei
2012-04-02 19:30:13 +08:00
使用mongodb的一个小坑,导致昨天出现了一些问题

thepast.me使用mongodb来存储文本数据
使用的是linode的vps,装系统的时候,选择了32位的debian
结果在32位下,mongodb的数据文件size有2G的限制
64位没有这个限制。

http://blog.mongodb.org/post/137788967/32-bit-limitations
larvata
2012-04-02 20:12:55 +08:00
不太准 而且似乎样本不全? 很多都是只用过一次的关键词 被挑出来了
yuhuofeihe
2012-04-02 20:20:00 +08:00
微博 小米 手机 电信 百度 google 分享 新浪 投稿 好友 电脑 javascript 朋友 投票 推荐 iphone jquery flash 中国 粉丝 大学 京东 女人 笑话 工作 贴吧 腾讯 微软 新闻 miui

我怎么觉得有的关键词跟我关系不大呢~
不过 女人 这个关键词真心亮了,如果是Loli那就更亮了~
clippit
2012-04-05 12:43:16 +08:00
南京 火车 大学 电影 google 电视剧 android 微博 地铁 pm 汽车 爹 推荐 中国 javascript wordpress css 宿舍 设计 上海 twitter

『爹』是因为我说过很多次『坑爹』么……另外地名好多……
wdd2007
2012-04-05 12:54:58 +08:00
个人关键字

微博 iphone google 产品 人人 中国 360 手机 北京 京东 互联网 淘宝 android ipad 设计 朋友 分享 小米 新浪 百度 密码 视频 广告 工作 苹果 免费 美元 ios 评论 csdn
byron
2012-04-05 13:13:17 +08:00
正在努力从第三方网站同步你的timeline,请稍等刷新页面查看...
byron
2012-04-05 13:22:30 +08:00
微博 手机 语音 阿里 设计 杭州 输入法 中国 miui 晚安 建筑 产品 facebook 北京 评论 google iphone gmail china 梦想 免费 飞机 诺基亚 安全 人生 分享 表白 团队 网络 新浪
ElmerZhang
2012-04-05 13:33:44 +08:00
微博 新浪 mac 中国 应用 技术 移动 咖啡 iphone ubuntu php 分享 域名 ruby sina ipad 手机 服务器 api wordpress it 开源 北京 安全 高铁 android google python linux ipad2
freeznet
2012-04-05 13:37:23 +08:00
youtube 微博 google 推荐 尼玛 好友 chrome iphone amazon 水果 中文 囧 老罗 硬盘 游戏 北京 苹果 影视 下载 帝都 神马 测试 web ios 今晚 程序 草莓 床 文艺 快递

今晚...今晚你妹啊今晚
laiwei
2012-04-06 13:36:52 +08:00
@freeznet 今晚 床 都亮了,汗

@clippit 现在的关键字 还在调整,后续会看到更多个性化的关键字

另外,加了一个很有意思的小功能: "我的过去"栏目,展示昨天 以及历史上的今天的status

http://thepast.me/past
sigone
2012-04-06 13:53:08 +08:00
独立思考 热衷创新 吃喝玩乐
hq5261984
2012-04-06 14:29:52 +08:00
微博 北京 中国 实名 上班 上海 周末 过去 文章 分享 狗 火锅 朋友 韩寒 开心 土豆 幸福 裸 视频 生病 变态 性感 测试 宅 山东 烧烤 歌曲 学生 围观 陈奕迅

分词算法有待提高.陈奕迅貌似跟我没关系.
cress
2012-04-06 14:32:38 +08:00
google facebook 推荐 twitter 微博 app 设计 分享 相册 梦 豆瓣 youtube gmail 日记 手机 照片 同步 ipad 床 中国 兴趣 故事 社交 社会 女儿 小组 茶 运营 上海 design

女儿、床 是怎么回事。。。。。。
cress
2012-04-06 14:33:15 +08:00
和自己真正的关键词相差太远。。。
xiyuemu
2012-04-06 14:58:40 +08:00
这个能否作为同步备份功能?或者加强一下,生成自己在各大2.0网站内容的timeline然后输出?

个人关键字
电影 blog 中国 微博 故事 梦 历史 文章 翻译 毕业 推荐 北京 豆瓣 文字 男人 爸爸 朋友 图片 政治 老师 美国 上海 搜索 晚安 小说 日记 妹子 日本 学习 百度
laiwei
2012-04-06 15:04:34 +08:00
@xiyuemu

thepast的初衷就是同步备份 加 离线阅读

现在提供将聚合后的timeline 输出为PDF,可以下载。

提取关键字 只是一个有意思的小功能,还不完善。
xiyuemu
2012-04-06 15:06:41 +08:00
另外,似乎没有控制PDF输出的地方?
xiyuemu
2012-04-06 15:09:57 +08:00
再多一个建议吧,可以开放API,让更多用户去自定义导入来源,这样也就不需要你一个个网站自己做了。当然,现在有豆瓣有围脖就已经蛮足够了,其他地方如博客之类信息量都比较大呵,似乎不方便做这种个人杂志。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/31118

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX