V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  oaa  ›  全部回复第 1 页 / 共 1 页
回复总数  13
22 天前
回复了 gk2014 创建的主题 程序员 放弃幻想吧,苦逼的码农们
我觉得最重要的是还是你想创造的东西,而不是创造这个东西的手段。
1 ) Readability ,https://github.com/mozilla/readability ,是一种基于规则的方法,被 Mozilla Firefox 浏览器的阅读模式使用,它通过检查 HTML 元素的标签名称、文本数量、链接密度以及满足主要内容标准的文本模式来提取主要内容

2 ) DOM Distiller ,https://github.com/chromium/dom-distiller ,是 Google Chrome 浏览器的阅读模式,它是一种混合方法,使用了 Boilerpipe 分类器和一些规则,有点类似于 Readability

3 ) Web2Text ,https://github.com/dalab/web2text ,是基于深度神经网络的分类器,使用了 CNN 模型和包括单词计数、标点符号存在和停用词数量等 128 个结构和文本特征来确定每个文本块是否属于主要内容

4 ) Boilernet ,https://github.com/mrjleo/boilernet ,是基于深度神经网络的分类器,使用 LSTM 将网页的文本节点视为由单词和 DOM 树根路径组成的文本块序列
好像还有个啥论文。。
via https://twitter.com/Barret_China/status/1729889136520335606?s=20
2021-09-02 04:08:33 +08:00
回复了 exceldream 创建的主题 程序员 大家如何打造自己高效的开发环境
和简悦比感觉怎么样
数据和显示完全分离吧 基于区块链或 github 做
悲哀,太 TM 悲哀了。唉。
2021-01-12 13:31:30 +08:00
回复了 zictos 创建的主题 Windows 剪贴板工具除 ditto 和 clcl 外,还有两者优点结合的替代品吗?
copyq
2020-12-01 14:42:27 +08:00
回复了 oaa 创建的主题 分享创造 ”action base programming“ 宣言
本质上讲还有 ide-actions 等各种 actions
2020-12-01 14:41:51 +08:00
回复了 oaa 创建的主题 分享创造 ”action base programming“ 宣言
@levelworm 对头 就是这个意思
2020-08-17 10:32:30 +08:00
回复了 oaa 创建的主题 求职 4 年开发经验 测试驱动 敏捷开发 熟悉微服务环境
想改也改不了了,T_T 我手滑想点预览点成发布了 233
看起来很有趣 投了.
2020-08-16 17:46:11 +08:00
回复了 oaa 创建的主题 求职 4 年开发经验 测试驱动 敏捷开发 熟悉微服务环境
工作意向: 后端 docker 容器化 其他有 有趣产品的公司
2016-08-07 22:49:45 +08:00
回复了 jianleer 创建的主题 奇思妙想 将个人行为数字化统计的方法
有限的状态无法描述无限的人类行为 但是可以描述部分的人类行为 在一些情况下 已经够用了 问题是如何判断现在是什么行为 我觉得现在最可行的方式还是自己打标签 有一个始终运行在后台的软件监控着手机电脑 由人类自己来设定干了什么 参见 ManicTime
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   4129 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 24ms · UTC 05:17 · PVG 13:17 · LAX 22:17 · JFK 01:17
Developed with CodeLauncher
♥ Do have faith in what you're doing.