V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  practicer  ›  全部回复第 2 页 / 共 8 页
回复总数  149
1  2  3  4  5  6  7  8  
2016-12-20 07:23:14 +08:00
回复了 qinxi 创建的主题 程序员 刚入职,遇到这样的代码,怎么办...
先把网站搞挂掉,再自己修好,引起领导重视?
from operator import itemgetter
from collections import Counter

# 合并列表, 思路是先将字典转为可哈希的元组
list_merged = [dict(t) for t in set([tuple(d.items()) for d in list1+list2])]

# 根据字典某个值来排序, 官方库有推荐姿势 -- operator.itemgetter
sorted(list_merged, key=lambda k: k['score'], reverse=True) # 没用 itemgetter
sorted(list_merged, key=itemgetter('score'), reverse=True) # 使用 itemgetter

# 保存重合项
list_tuple = [tuple(d.items()) for d in list1+list2] # 仍先转为元组, 使其可哈希
counts = Counter(list_tuple) # 通过 collections.Counter 查找重复项, 只接受可哈希对象
item_dups = set([i for i in list_tuple if counts[i] > 1]) # 保留出现次数大于 1 的项, 并去重
list_new = [dict(t) for t in item_dups] # 元组转回到字典对象
2016-12-13 16:55:28 +08:00
回复了 doer233 创建的主题 Python 分割列表
@SakuraSa 最佳
2016-12-02 13:45:21 +08:00
回复了 ansheng 创建的主题 程序员 聊聊你对学习 Python 的几个阶段?
第一阶段: 零基础 → Flask web programming,核心编程 2, python 标准库, 《 web crawling with python 》,bs4 文档
第二阶段:《 Learning Scrapy 》, scrapy 文档 , 《 Python.for.Data.Analysis 》, youtube 上 data school 频道的一系列视频教程, 《 Python.Machine.Learning 》
第三阶段:《 python cookbook 》, 《 Effective Python 59 SPECIFIC WAYS 》, 《 Problem Solving with Algorithms and Data Structures Using Python 》

逐渐形成了先找一本书教我做一个东西出来, 再过一遍官方文档的学习方法
2016-11-28 16:16:01 +08:00
回复了 kiros 创建的主题 问与答 突然很想带着老婆孩子逃离这里一年,求推荐宜居小城市
惠州: 有海有山, 考虑买房不? 一万以内很多选择
2016-11-25 16:09:59 +08:00
回复了 smithtel 创建的主题 深圳 各位会考虑小产权房吗,如题。
小产权房严格来说就是你虽然花了钱买了房但证明不了它是你的房的房子
2016-11-25 16:02:35 +08:00
回复了 KagamineLenKai2 创建的主题 Python 求教,怎样在 python 里执行 sql 查询……
自从用了 pandas, 读写 db, 文件再也不郁闷了
import pandas as pd
pd.read_sql()
2016-11-21 16:25:54 +08:00
回复了 practicer 创建的主题 Python python 多线程爬虫问题
@nik 我在十八线省会城市, 不在北京
2016-11-20 00:55:26 +08:00
回复了 Antidictator 创建的主题 程序员 看技术文档 PDF 之类的比较适合是 Kindle 吗?
淘宝搜打印书, 5 分一页, 打印出来看最实在
格式是正确的格式吗?
2016-11-16 10:46:05 +08:00
回复了 domino 创建的主题 Python Python3 编码问题
解决响应文本编码问题, 用 requests 包更方便

import requests
from bs4 import BeautifulSoup
html = requests.get("http://home.baidu.com/")
soup = BeautifulSoup(html.content.decode('utf-8'), "lxml")
print(soup.title);
2016-11-09 23:11:32 +08:00
回复了 woojuno 创建的主题 程序员 从哪买正版外文书?
告诉楼主一个省钱省事的办法, 我近三个月看了不下三四本出版书和官方文档, 你参考一下
1 去到资源网站下载 pdf 电子版, 这些网站提供的都是正版 pdf, 带目录, 带封面, 将他们下载
2.然后上万能淘宝, 搜"打印书", 找一家离你近的店, 要求卖方选书面纸(非白纸, 偏黄色, 比 A4 纸薄), A5 大小(地铁上方便拿, 大小很舒适), 彩色封面, 侧身打印书名

资源站:
1.http://gen.lib.rus.ec/(我用得次数最多, 资源全和新)
2.http://www.salttiger.com/(中文网站, 国内网盘下载速度块)
3.http://scanlibs.com/ (前两个够用了, 这个作为补充)

我下了不少机器学习和数据处理的书, 按这个方法陆续打印了六七本, 平均每本 25 块(一本 300 页以内, 书面纸比普通白纸贵 3 分 /页). 效果就是, 在地铁上刷刷的把书看得很快, 长期积累下去对自己的帮助还是很大的.主要是因为所看的书时效性非常块, 都是和工作联系非常紧密的内容, 所以一边应用一边刷理解的快, 学的好.

希望对你有所帮助.
我们兄弟科室的领导在每月大会上, 分享如何在每周周会上利用机会练习表达的, 他还分享通过练习后自己的细微变化, 虽然他的分享和我的工作无关, 但我对我仍然有用, 输入影响输出, 所以要不断练习输入的能力, 和敲代码一样一样的, 熟能生巧.
2016-11-02 14:30:03 +08:00
回复了 datayes2015 创建的主题 推广 [sklearn 机器学习] ——应用机器学习的建议
谢谢分享, 如果数据量大, 如何效率的调参数, 如何效率的调整特征呢? 由于每次训练会耗时过久, 有应付的方法吗?
2016-10-25 09:08:16 +08:00
回复了 771456556 创建的主题 Python BeautifulSoup 怎样才可以 find_all 再次 find_all 结果
get_all_secondary_elements(bs)

try:
top_elements = bs.find_all(...)

for top_element in top_elements:

secondary_elements = top_element.find_all(...)

if secondary_elements is not None:
yield secondary_elements

except (AttributeError, TypeError):
yield


secondary_elements = list(get_all_secondary_elements)
2016-10-24 18:01:12 +08:00
回复了 Nexvar 创建的主题 程序员 面试的时候,你遇到过哪些算法?
@ma125125t leetcode 足矣, 如果是为了攒 star, 那是用 1024 爬虫吧
di.fm/vocaltrance
di.fm/trance
di.fm/classictrance
di.fm/techno
di.fm/progressive

动感+旋律, 这不就是电音嘛...希望楼主喜欢
2016-10-20 12:30:06 +08:00
回复了 justudy 创建的主题 程序员 在中国你们觉得哪个省的程序员比较多
@zuotech 有证据说明吗?
2016-10-13 15:18:38 +08:00
回复了 fjhmx 创建的主题 程序员 各位的 python 开发工具用的是什么?
做项目用 pycharm
小脚本用 sublime
机器学习和数据挖掘用 jupyter notebook
console 用 ipython
1  2  3  4  5  6  7  8  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1946 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 31ms · UTC 00:02 · PVG 08:02 · LAX 16:02 · JFK 19:02
Developed with CodeLauncher
♥ Do have faith in what you're doing.