V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  wisej  ›  全部回复第 9 页 / 共 12 页
回复总数  235
1  2  3  4  5  6  7  8  9  10 ... 12  
2018-04-27 17:22:22 +08:00
回复了 mathzhaoliang 创建的主题 问与答 怎样破解加密的 excel 的.xlsx 文件
软件暴力破解最后可以考虑下的。我当时是跑出来了,虽然是纯数字的
2018-04-27 17:10:16 +08:00
回复了 hackpro 创建的主题 问与答 请教如何处理 Python 中的异常以保证脚本能够长时间运行
@hackpro 支持 markdown 的代码格式的,在 ide 里写好复制一下就好了
2018-03-31 14:46:57 +08:00
回复了 wisej 创建的主题 问与答 是什么原因导致 12306 出现这种情况?
@zro 是呀,能看到是硬座。但是一点确认改签,它弹出说票没了,自动改签无座去了
2018-03-31 14:02:55 +08:00
回复了 wisej 创建的主题 问与答 是什么原因导致 12306 出现这种情况?
@zro 就是说它现在不是这样的。我订的时候,一直到最后一步确认,都没有提示说票不足。然后点了确认改签,才告诉我没票了且自动改到无座了。所以觉得真的好莫名其妙
2018-03-30 10:46:02 +08:00
回复了 wisej 创建的主题 问与答 是什么原因导致 12306 出现这种情况?
@ThirdFlame 可是我就是无座的票想换有座的啊,摔~它相当于把无座改签成无座,顺带浪费我一次改签机会,啊。。
2018-03-21 10:25:44 +08:00
回复了 wisej 创建的主题 问与答 有没有实现了网页上的画板功能的轮子?
@suit 非常抱歉,不知道为什么,V 站没给我消息提醒,所以现在才看到 - - !很符合我的需求,谢谢您~
@sevenQu 没有关系,只要你指定的是你所想要启动的 Flask 实例就行。你这里没有指定绑定的地址,就像我说的,你可以尝试加 -b 127.0.0.1:8000,这样才会监听到 8000 端口
@sevenQu gunicorn -b 127.0.0.1:8000
2018-03-06 20:16:02 +08:00
回复了 wisej 创建的主题 问与答 爬取各高校信息,有什么好的方案么?
@b821025551b 你怎么知道我要这么干:doge:,不过录取分数线还是得走那个网站
2018-03-06 18:39:34 +08:00
回复了 wisej 创建的主题 问与答 爬取各高校信息,有什么好的方案么?
@z919zzz 哇 我也是江西的。谢啦,已经决定就爬那个网站了
2018-03-06 14:44:36 +08:00
回复了 wisej 创建的主题 问与答 爬取各高校信息,有什么好的方案么?
@dobelee 是啊,每个高校网站结构还不一样。所以很好奇那个网站是怎么做的
2018-03-06 11:39:41 +08:00
回复了 wisej 创建的主题 问与答 爬取各高校信息,有什么好的方案么?
@Len1133 这个我有印象,但是早忘了书名是啥,更别说网站了
2018-03-06 11:37:26 +08:00
回复了 wisej 创建的主题 问与答 爬取各高校信息,有什么好的方案么?
@lunatic5 本科得有 - -
2018-02-25 18:31:20 +08:00
回复了 AlwaysBehave 创建的主题 问与答 一加氢 OS 开启的加密到底是什么加密
有 好像默认就是加密的
2018-02-20 13:05:08 +08:00
回复了 jakeyfly 创建的主题 问与答 requests get 下来是乱码 咋解决求大佬
我来梳理一下吧:

首先 requests 里关于获取编码的几个函数:
1. `get_encodings_from_content`:utils.py 中定义,譬如从 HTML head 的 meta 中获取 charset
2. `get_encoding_from_headers`:从响应头的 Content-Type 来猜测
3. `chardet.detect`: 编码自动检测工具

然后 requests 处理编码方式的流程是这样的:
1. 首先看响应头的 Content-Type 里是否包含 charset,有就设置并返回
2. 若 Content-Type 里没有 charset,但是 MIME 是 text/*,则直接设置编码为 ISO-8859-1 (这一点 requests 是为了遵循 RFC2616/3.7.1 )
3. 当第 1、2 点都不符合时,encoding 为空,才使用 chardet.detect 自动检测

**问题所在**:
第二点导致国内很多网站的编码方式被认为是 ISO-8859-1,在西方国家,没啥大问题。但是在亚洲很多国家,将会出现乱码

具体讨论可以看: https://github.com/requests/requests/issues/1604

PS:
1. 好像 RFC2616 中将默认编码设为 ISO-8859-1 已经被弃用了。然后 requests 上关于这个问题貌似还在讨论...( https://github.com/requests/requests/issues/2086

2. 很多人可能会疑问,为什么 requests 处理编码问题里没有用`get_encodings_from_content`,Lukasa 解释是这样的:
> Our position on this has been that we're not a HTML library, we're a HTTP library, and therefore examining the body of the request is outside our remit.

当然,你可以自行调用嘛:
```
import requests
from requests.utils import get_encodings_from_content

r = requests.get('http://baike.baidu.com/view/115789.htm')
codings = get_encodings_from_content(r.content)
if codings:
r.encoding = codings[0]
```
2018-02-20 08:47:18 +08:00
回复了 jakeyfly 创建的主题 问与答 requests get 下来是乱码 咋解决求大佬
@zyxbcde 我滴龟龟 所以你是这么早就起了?
2018-02-09 07:35:17 +08:00
回复了 ChenJinluo 创建的主题 Python 请问该用多线程还是单线程多个进程呢?
@wisej 如果有这个或者类似的检查设置的话
2018-02-09 07:32:37 +08:00
回复了 ChenJinluo 创建的主题 Python 请问该用多线程还是单线程多个进程呢?
1. 题目描述有问题,啥叫单线程多个进程?我的理解就是:用多线程还是多进程
2. 你启动多进程的方法…不方便而且不太好。应该使用标准库 mutilprocess
3. 这两个方法优劣。很简单,你两个方法都写出来,做个测试不就好了。重效率,你就比较执行时间。

一些拙见:数据库操作属于 io 任务。所以多线程是可以的。不过你得注意,如果你是一个线程一个连接,最好有连接池;如果共享一个连接,那你得加锁,同时创建连接的时候把 check_same_thread 设为 False
2018-02-08 17:39:41 +08:00
回复了 ve369587 创建的主题 Python python3 import 疑惑
为什么要把 main.py 放在 main 文件夹下呢?
直接把 main.py 放在 project 目录下面不就解决了
1  2  3  4  5  6  7  8  9  10 ... 12  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2940 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 23ms · UTC 00:40 · PVG 08:40 · LAX 16:40 · JFK 19:40
Developed with CodeLauncher
♥ Do have faith in what you're doing.