如果有一个网站,收录了国内几乎所有的网站并提供各行各业分类展示与快搜直达。请问这个网站是否合法合规,能否存活?

2020-12-30 09:20:20 +08:00
 wjpdev

几乎所有的网站定义: 包含所有网站,但违反法律法规的除外。

3319 次点击
所在节点    问与答
32 条回复
wjpdev
2020-12-30 13:38:44 +08:00
@Jooooooooo 必须的,网站导航的网站也是网站,哈哈
wjpdev
2020-12-30 13:44:14 +08:00
@hoyixi 赞同,本质就是一个 big 黄页,马云当年要做的一个东东
wangrongli
2020-12-30 14:58:56 +08:00
问题一,首先你如何搜集这些网站?要知道百度展现这些网站也是百度收录了的才予以展示,更多的网站百度是搜不到的,要直接输入网站的域名或者 ip 地址,因为有些网站没有绑定域名,你如何保证自己的爬虫比百度还牛 X 。

问题二,如果问题一的你解决了,要知道很多人基于百度搜索是关键词模糊搜索,比如:感冒了吃什么药?然后进入到一个网站,然而这是一个内页,网站的首页或者网站的名称与感冒了吃什么药一点关系都没有。你如何保证用户的需求与你做的列表网站匹配,正是因为基于好奇,用户也肯定不知道自己要搜什么样的网站,你如何解决?
wjpdev
2020-12-30 15:41:49 +08:00
@wangrongli 谢谢,提的问题很好。我想肯定没有一个十全十美的解法,它应该是已经可以满足一些人的需求,但又挡掉了另一些人的需求,人与人之间对它的需求本身有大量的矛盾存在,`这个网站`的需求实现肯定也是,哈哈。

1. 可以只考虑能通过域名访问的网站
2. `这个网站` 并不 care 网站内容,这不是它要做的事情。它要做的事情很简单:1. 它是一个网站,2. 网站是活的, 可以访问.

用户感冒了,他会搜医院、搜药店,`这个网站`会直接列出数量最全的国内各医院官方网址列表,列出线上卖药的网上官网列表,如果他知道常见感冒药的名字或厂商,`这个网站`能最快的送你到厂商的官网查看关于药的作用,或厂商的详细信息。
常规通过百度搜索,大家都懂的,百度做的不够好,很容易带用户掉坑里去,也浪费用户的时间和金钱


你提到的需求点: 用户也肯定不知道自己要搜什么样的网站
方案 1: 开一个 page 展示各类最近新收录的网站,用户随意浏览. 万一有一个他就感兴趣了呢
方案 2: 加个 vote 功能,通过大众用户投票选出各类 top rank 网站供用户选择

我觉得时间久了,应该会在各类别中沉淀出一些优质的、实用的、好玩的、新奇的网站 rank
FallenTy
2020-12-30 16:51:03 +08:00
很多小网站,没用过之前只看名字页面根本不知道是干啥的,你怎么让用户能根据搜索进去呢
huzy8002as
2020-12-30 17:39:11 +08:00
你这想法优化到最后,其实和搜索引擎也不会有太大的区别。单单只是搜索网站域名,没什么人会有兴趣的,你就得不断改进,改进到后面,发现模板就是搜索引擎。
wuzhanggui
2020-12-31 08:36:22 +08:00
站搜搜? https://www.zhansousou.com/mini
可以搜索网站,一键直达
lonewolfakela
2020-12-31 10:07:10 +08:00
@shansing 说的就是 LZ 提的这种网站,最典型的代表是当年的雅虎……都是被时代淘汰的网站类型了,现在的人没听说过,以为自己又想出来什么新 idea 当大发现一样发出来……
sillydaddy
2020-12-31 13:29:38 +08:00
需要再深入想想啊,因为我总感觉你是停留在表面的想象上,而没有深入分析。
你举了几个例子,用来说明这个网站存在的必要性:
1. 一少部分人有好奇心。。无聊的想看看好玩的网站
2. 给个关键字,一下子找到学院官网
4. 有很多新鲜、有趣、实用、好玩的网站,没被人发现
5. 行业细分,细分领域有很多值得挖掘的

1 和 4 很明显是重复的,其主要目的就是,让用户可以主动发现新鲜的网站,
2 的话,搜索引擎会比这个网站差?
5 的主要目的,深入想一下,会发现跟 1 和 4 是一样的——网站细分不就是为了让人便于主动发现吗?

所以,这个网站的意义就是:让人**主动发现**新鲜的东西。
这里的**主动发现**,是指那些搜索引擎不能直接提供的,搜索引擎不能理解的,比如“推荐一些有趣的前端网站 /工具”。

那么这种**主动发现**,如果要做成全领域各行业的,那得是多大的投入呢?
. 收集的网站,总数得是亿万级别的吧;
. 然后是分类分行业,光靠域名不行,还要分析网站的内容,这个靠人工?
. 只分类也不行啊,因为想做的是找到新鲜有趣实用好玩的,所以要给它们排名,或者有推荐机制,越好的越靠前,否则一个分类下成千上万的网站怎么能行。比如独立博客的量级至少有几十万吧。

当然,可以只做好收集和分类,然后把某个细分领域的所有网站列出来,留给用户自己去筛选。但即使是只关注某个细分领域( 比如你说的,发现“设计、前端、工具类”里面的新玩意儿) ,像前面说的“收集网站、分类”还是要做,而且靠程序不行,因为程序理解不了,还是要人工来做。。这个工作量。。一个细分领域尚且不能,谈何做各行各业呢?
wjpdev
2021-01-04 10:46:03 +08:00
@wuzhanggui 不错啊,和 idea 比较像了,UI 很棒
wjpdev
2021-01-04 11:33:48 +08:00
@lonewolfakela 哈哈,不要局限于过去 黄页 样子的旧思维模式,据我所观察到的,现在大部分的黄页和导航网站仍然停留在过去和今天的样子。我设想的 idea 里 `这个网站` 还是会有所不同:

过去 祼装时代: 一个简单的静态 page, 按主要分类罗列了国内主流、大众经常访问的 website,总的算下来网站数量几十来个上百个,website 列表不会怎么变,转来转来就那一些。尤其是零几年那会著名的 hao123 导航,给国内普通网民带了方便,毕竟当年网站少,确实也就那么一些靠谱的,现在看就狭隘了,反而局限的大众的眼光,普通网民知道的还是当年的那一批 website 。

现在 新衣时代 1: 仍然是一个简单的静态 page,UI 变好看了,page 顶部 嵌上了 Google\百度\搜狗 搜索功能,website 内容更丰富了,但是:website 数量仍然偏少,远不匹配目前井喷式的各类网站数量,相当相当多的网站是没有机会出现在导航里面的。另外 上面嵌入的各类搜索引擎,仍然是基于网站内容搜索,我想搜一个符合特征(比如高校)的网站,仍然逃不脱要在各种信息、知识、广告、内容的搜索结果中去靠自已进一步过滤掉不想的信息。

我作为一个网民,核心要求很简单:我只想得到一个 target website, 我不想在那么多杂七乱八的内容信息里扒出那个 target website 。
现在有吗?

新衣时代 2(1+1): 做细分垂直类的网站导航,优点:把某一个专业下的出名的、很好的网站罗列出来了。比如工具类、设计类、产品类、资源素材类的细分导航。缺点:和新衣时代 1 差不多。

上面共有的缺点:新网站、极少数优质的网站大部分网民仍然不知道它们的存在,它的出现只存在于某些人的知乎答案中,各种网文的网址推荐中。如果运气好,你可以看到它,访问后觉得:确实不错,是个好网站。

未来 标签、智能时代 (`这个网站`):
1. 很显然数量要比新衣时代上一个指数台阶,
2. 收录的网站是什么类型,什么性质,什么特征,什么功能,什么属性,给它打上 n 种标签
3. 如果未来人流量可以起来,基于大数据,`这个网站`知道了哪些网站是热门的、哪些是好的差的,哪些是大牌,哪些是小众,哪些是新生,提供给网民各种指标下的网站内容集合。我想信这可以给网民们带来一些价值。

`这个网站` 要开刀的对象很简单:只 care 你是个网站,其它我不管。

有人会说,那你不管,谁来管?

交给网民来管怎样: 他访问了,觉得很烂,就用脚投票它,觉得很棒就大拇指。

我举几个例子,有的网友可能会遇到:

> 今天我手上有个 pdf 文件,想转成 doc, 上搜索引擎搜 pdf 转 doc 。 奶奶的,找了半天没一个好用的,有的还要钱?!
> 我想找一个网站下载一个 4k 高清电影,上搜索引擎搜 4k 高清, 奶奶的,各种电商卖显示器、其它的内容...
> 我想找一下能下载 磁力链接的网站,怎么这么难?
> 考上大学了,我不知道湖北武汉科技大学有哪些学院,他们的官网我想看一下介绍. 靠百度? 还得您费时间在结果再找一找


-------------------------------
上面是我暂时想到的一些点,参考一下,哈哈。
wjpdev
2021-01-04 11:40:19 +08:00
@sillydaddy

1 收集的网站,总数得是亿万级别的吧 ? <------- 这个我调研过,往大了点算,国内网站总数量也就百万个,不超过千万。
> 据统计,截至 bai2017 年底,我国网站数量 du 达到 526.06 万个。从 zhi 地域分布看,我国网站 dao 发展情 zhuan 况与经济发达程度密切相 shu 关,总体呈现东部地区多、中西部地区少的发展格局,区域发展不协调、不平衡的问题较为突出。截至 2017 年底,东部地区网站占 68.91%,中西部地区占比分别为 18.49%和 12.61%。
> 2018 年底中国有 500W 个网站 来源:卢松松博客
这个量大吗?

2. 像前面说的“收集网站、分类”还是要做,而且靠程序不行,因为程序理解不了,还是要人工来做。。这个工作量。。一个细分领域尚且不能,谈何做各行各业呢? <------ 对的,这个正是最难的部分,哈哈,所以挑战性在这儿。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/740193

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX