V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  aploium  ›  全部回复第 4 页 / 共 6 页
回复总数  103
1  2  3  4  5  6  
2017-02-26 22:02:57 +08:00
回复了 doulmi 创建的主题 Python Python + selenium + phantomjs 求助,爬一个网站的信息
```python
import requests

data = {
'X-Requested-With': 'XMLHttpRequest'
}

for i in range(1,10):
url='http://www.kuajingjishi.com/Purchase/SearchPurchase?pageIndex={page}'.format(page=i)
r=requests.post(url, data=data)
print(r.text)
```
2017-02-12 19:11:03 +08:00
回复了 ayanamist 创建的主题 酷工作 [杭州]中间件团队招聘
支持~
2017-02-12 17:33:00 +08:00
回复了 changwei 创建的主题 程序员 你们觉得哪个编程语言的坑最多?
@huntererer 觉得 python 编码坑的大概还停留在 2.x ,而且不会__future__吧
在实际中用的最多还是 base64
base85 有时候涉及到麻烦的转义, 会带来额外字节的浪费, 还有安全性问题
base64 对编解码器(还有人类!)也比 base85 更友好一些
反过来想, 要是有一种吊炸天又实现不复杂的编码方式, 为什么那么多天才工程师不用呢 :)
2017-02-12 15:33:48 +08:00
回复了 RE 创建的主题 问与答 关于 GitHub 的用户名,首字母你们选大写还是小写呢?
同纠结过这个问题.....从大写改成了小写
项目起名本来也是 RepoName 这样的, 后来决定新项目全部改成一个小写的单词

`Great repository names are short and memorable`
这句话是在新建 repo 的时候 github 提示的
那些大项目基本也确实都是很短很好记, 一个单词的

1. 如果不是出身豪门的项目, 命名考虑对 SEO 友好, 即比较独特, 搜索引擎出来的前面就是它
2. 对键盘输入友好
3. 好记
4. 英语可以发音 (我的 username 是个失败的例子)
5. 最好是一个单词, 纯字母, 不带下划线和短横

ps: github 不区分大小写
2017-02-12 00:54:42 +08:00
回复了 forrestchang 创建的主题 职场话题 关于 17 年的暑期实习,现在应该准备一些什么?
同大三+Python 找实习....后排坐等大佬.....已经决定翘课实习
2017-02-11 15:57:59 +08:00
回复了 intohole 创建的主题 Python 一个自己写的工具箱,看看大家是否需要
2017-02-11 15:55:06 +08:00
回复了 ns2250225 创建的主题 Python 基于 Django 的个人小博客
安全提醒: django 线上部署请务必关闭 DEBUG 选项, 否则可能导致任意代码执行
2017-02-09 21:46:47 +08:00
回复了 neurocomputing 创建的主题 问与答 大家一般到哪里推广新产品
hackernews 会有一些推广, 不过受众很窄, 只有 geek(我没试过效果)
lz 的意思应该是如何只写一个括号, 但是使得 \1 \2 \3 \4 都出现, 并且是对应的匹配值
mark 同问 (ls 的好像不行啊)


如果只是题中的简单情形,可以用(python) re.finditer
```
for m in re.finditer("(\d+)-","123-456-789-123-"):
print(m.groups())
###
('123',)
('456',)
('789',)
('123',)
```

但是对于复杂一点的, 比如 cat-123-456-789-123-dog
:(
2016-10-26 19:46:41 +08:00
回复了 ccw55 创建的主题 问与答 大家在用什么内网穿透工具呢?
https://github.com/aploium/shootback
因为 ngrok 很不稳定所以自己写的, 可以试试看
同问, 另外 {{ }} 也是 django 模板语法的一部分.....而且相当常用
2016-10-21 15:57:48 +08:00
回复了 bboysoul 创建的主题 程序员 大家都用什么 markdown 编辑器的, windows 平台下的。
PyCharm 的 Markdown Navigator 插件(付费), 兼容 github 实时预览
2016-10-19 20:18:46 +08:00
回复了 mbfan 创建的主题 随想 请问有没有 能让一个手机成为另一个手机键盘 的应用?
mark, 顺便问有没有让手机屏幕变为外接显示器 的东西, 扩展到电脑或者另一台手机
2016-10-13 19:53:37 +08:00
回复了 harryw 创建的主题 Python Python3.x 的编码问题,求教
把它交给 requests 处理吧..

requests.get("https://movie.douban.com/subject_search",params={"cat":1002,"search_text":"你的名字"})
2016-10-12 23:16:18 +08:00
回复了 wlee1991 创建的主题 正则表达式 怎么用正则去匹配尖括号之外的所有空格?
@sutra 还有一种恶心的 case:
```
<tag/> 我在 tag 外面 > > ←这是两个不规范的→尖括号
```
2016-10-12 22:59:17 +08:00
回复了 wlee1991 创建的主题 正则表达式 怎么用正则去匹配尖括号之外的所有空格?
为什么不支持 markdown - -
2016-10-12 22:59:00 +08:00
回复了 wlee1991 创建的主题 正则表达式 怎么用正则去匹配尖括号之外的所有空格?
```python
# Python 3
impor re
# text = 你上面的那段
result = re.sub(r"""(?<!<)([^>]*?)( )(?![^<]*>)""", "\g<1>+", text)
print(result)
```

上面这段正则把尖括号之外的空格替换为加号(+)
能力有限, 不知道怎么把第一个捕获括号变成非捕获的. 因为 python 要求 look-behind 必须是 fixed-width pattern
结果为:
```
<img src="699.jpg" alt="" width="620" height="350" title="" align="" />+++太难了。多行汉字。多行汉字。多行汉字。
++太难了。++<img src="699.jpg" alt="" width="620" height="350" title="" align="" />
多行汉字。多行汉字。多行汉字。多行汉字。
++怎么办。呵呵
```
注意其中有一行的开头是 Tab, 不是空格, 所以没替换掉
1  2  3  4  5  6  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2744 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 31ms · UTC 13:56 · PVG 21:56 · LAX 05:56 · JFK 08:56
Developed with CodeLauncher
♥ Do have faith in what you're doing.