V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ClericPy  ›  全部回复第 129 页 / 共 130 页
回复总数  2583
1 ... 121  122  123  124  125  126  127  128  129  130  
2019-07-20 14:27:55 +08:00
回复了 tuding 创建的主题 程序员 怎么将每日爬虫的执行结果通过微信推送给自己?
以前 v2 有人推广过他的项目,不过不是天天推那种,好像就是用他的公众号实现推送 api 的

模版消息在服务号上(企业认证)可以使用,个人订阅号貌似不行,不过我试了微信官方那个沙盒 sandbox 环境的测试号是可以用模版消息的,可以考虑用测试环境来搭,反正只给自己用

楼上们提的 Server 酱看起来还行
2019-07-17 00:54:26 +08:00
回复了 ke1e 创建的主题 程序员 失业了,接各种 H5, App 和微信相关开发需求。求口饭吃 T_T
开源个项目 Demo 有助于被猎头发现

同失业,在家无所事事假装学习如何找工作。。。
2019-07-17 00:51:41 +08:00
回复了 marco25 创建的主题 Python 用惯了 django 改用 flask 有感
走 asgi starlette 以后腰不酸腿不疼
2019-07-17 00:49:19 +08:00
回复了 yumenoks 创建的主题 Python 一个爬虫的过滤问题
国外的有域名就有 ip,有 ip 就有地域吧,一大堆速度超快的 ip 转地域的,淘宝啊搜狐啊腾讯啊
遇到爬虫陷阱爬虫蜜罐或者脏数据混淆等反爬手段,没啥好办法啊,socket 连一下试试域名存在性?控制友好频率上代理池才是正路子,就算撇开是否合法,频率太高会被当作 dos 攻击告你的
2019-07-17 00:43:32 +08:00
回复了 waibunleung 创建的主题 Python python3.7 中的 async/await 以及 asyncio 问题
很多地方协程里 Task 和 Future 的设计复用了(甚至原样用)多线程的 concurrent.futures 那套
Task 类创建以后就开始执行了,Future 则不会
你挨个 await 用来等他们全跑完原则上没什么毛病,不过可能会有一些异常如果不是 return exception 的话会打断 for Loop
所以可以考虑用下原生的 asyncio.wait 等方法来实现
2019-07-17 00:38:48 +08:00
回复了 Snail233 创建的主题 程序员 想问下各位 V 友真的很喜欢穿格子衬衫么。。。
我只喜欢纯色
我妈买了 4 件格仔衫我能怎么办
woca...
我就想问下,里面那些特质不对么
2019-07-12 17:42:34 +08:00
回复了 luhuan97 创建的主题 Python 9102 年了, Python3 首行还有必要加编码注释吗?
以前一直以为 py3 不需要 shebang 上加编码的,结果有天发现报错了,复现原理是

在 Windows 平台上
如果一大串字符串里有从网页复制的非法字符时候, 会报错
SyntaxError: Non-UTF-8 code starting with '\xe0' in file
但是 shebang 带上# ! coding:utf-8 就不报错

以前我在群里和人讨论过

https://gist.githubusercontent.com/ClericPy/7ef32e1456df013dfd97cbd2b5835238/raw/932a69a10477408ef771a3dc3146611bee0eba04/test_python3_encoding_error.py


可以试试去掉 shebang 那句
2019-07-12 17:34:38 +08:00
回复了 MrWhite 创建的主题 程序员 想问一下哪一门编程语言入门就很难学呢?
你去那些培训班看看各个语言的价格,大体心里有个数,然后也能知道你可以从他那里收多少钱,至于免费?教易语言,让他找工作去吧
2019-07-10 20:10:50 +08:00
回复了 snake8090 创建的主题 Python 一个关于动态页面爬取的问题!
写爬虫不管是靠它吃饭还是随便玩玩,http 那本书还是稍微读一下的好
2019-07-10 20:10:21 +08:00
回复了 snake8090 创建的主题 Python 一个关于动态页面爬取的问题!
对 python 来说,复制 curl bash,然后随便找个或者自己写个 curl Parser 发给 requests 就够了
2019-06-25 20:08:51 +08:00
回复了 brust 创建的主题 职场话题 我辞职了
@wu67 +1 个月,现在感觉还是上班好,996 都比在家做饭刷碗要强
2019-06-25 18:45:25 +08:00
回复了 Ljf980 创建的主题 程序员 亲人被骗 7W+ 该怎么维权
看完楼主遭遇警惕了一下
不过像我这种平民被骗了钱第一时间报警,已经不是默认选项里了吗。。。
目前活了这么多年,感觉人生如果真的有捷径的话,那就只有一条:高考
顺带一题,十几年前去过有个实训基地看过,我考研用的四本书在那里是教科书,而且他们面向的也是高考失利的,所以方向是没错的
考研四本书了解下。。。不然就让他报在线培训班吧
好奇地看了下楼主发过的帖子... 似乎不该有迷茫了吧...
高数线代概率论, 数据结构与算法, 计算机组成原理, 操作系统, 计算机网络, 数据库概论, 学校里的基础课每门都有用, 但是用在哪一时间还真说不大出来

如果前期, 找个教程从头过一遍知道编程什么样子才是正理
中期就恶补一下上面提到的专业课, 不要求满分什么的, 起码知道是个什么, 学会如何读懂文档和问问题, 搜问题(从 Python 官方文档开始最好, 然后善用 Google / stackoverflow), 大致了解下那些范式或者方法论的东西, 比如那几个原则什么的
像你已经工作几年的话, 基本上就是读源码参与开源项目, 多点实战经验了吧, 锻炼你说的这几个能力的书读过基本, 感觉对我并没有太大收获... 反而上学时候的基础书受益很久, 编程思维的成熟和环境关系很大的, 平时如果工作总是按部就班地写写业务代码, 就只能下班空闲时间自学了, 多个圈子一块讨论是个不错的选择

至于你提到的微积分, 高数或者线性代数, 感觉平时也就处理数据分析的时候用到过, 金融各种曲线
反而概率与统计这个方向挺常见的... 尤其是现在很多人工智能的东西基础课都离不开这几个数学知识

Just Do "IT"
2019-06-01 10:41:22 +08:00
回复了 Alberte 创建的主题 程序员 爬虫遇到验证码问题
cdp 用的好的话, 直接拿到图片二进制数据, 解码出来去识别就行了吧, 又截图又切图的不费劲么... 甚至上面说的也没毛病, 拿到同样的请求(对 cdp 来说拿到请求体其实就能拿到流量了, 不该多此一举), 包括 cookie 什么的, 再次请求拿到的图片是同一个, 二次请求也可以
简单地说, 就是 chrome devtools protocol 了解一下, 开调试模式, 挂 websocket 截流量, 识别图片的验证码, 然后注入 js 来填写

不建议非测试工程师走 selenium, 个人意见...
目前的 cdp 的 Python 轮子因为不像 nodejs 那么适配 chrome 里的以事件导向的异步, 没有太多好轮子, pyppeteer 的协程差不多能实现, 不过我用的时候死在下载 chronium 上了... 就自己造了个简单同步的轮子(就是 block 主线程去等事件...)
2019-06-01 10:17:27 +08:00
回复了 fourstring 创建的主题 Python 关于 Ubuntu 下编译安装 Python 时 OpenSSL 库问题
3.7 和 3.6 以前的这个依赖不一样了, 既然都选择 Ubuntu 了, 使用
apt-get install python3.7-dev
就可以了
我给阿里云机器升级的 Ubuntu 18 用的这个方法, 反正 python3-dev 是不够用的
1 ... 121  122  123  124  125  126  127  128  129  130  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1118 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 43ms · UTC 18:29 · PVG 02:29 · LAX 11:29 · JFK 14:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.