英伟达小姐姐的Python隐藏技巧合集，推特2400赞，代码可以直接跑

知行编程网 2022-04-11 01:00 知行编程网 | 隐藏边栏 | 抢沙发 | 4 0

文章评分 0 次，平均分 0.0 ：

栗子发自凹非寺
量子位报道 | QbitAI

常常发资源的英伟达工程师小姐姐Chip Huyen，又发射了一套Python隐藏功能合集。

里面都是她“从前没发现，或者从前不太敢用”的机器学习技巧，有notebook可以直接跑。

合集名叫python-is-cool，推特宣布之后不到半天，已经收获了2400+赞。

那么，这份令人奔走相告的资源，到底长什么样子？

隐藏技巧五大类

就像开头提到的：这里的功能，要么是小姐姐花了很久才找到的，要么是曾经让她瑟瑟发抖到不敢尝试的。

不过现在，她的技巧已经成功支配了这些功能，于是分享了出来。

目前一共有5个版块，专注机器学习，日后还会持续更新：

1、Lambda、Map、Filter、Reduce函数

lambda 关键字，是用来创建内联函数 (Inline Functions) 的。square_fn 和 square_ld 函数，在这里是一样的。

 square_fn(i) == square_ld(i)

lambda 函数可以快速声明，所以拿来当回调 (Callbacks) 函数是非常理想的：就是作为参数 (Arguments) 传递给其他函数用的，那种函数。

和 map、filter 和 reduce 这样的函数搭配使用，尤其有效。

map(fn,iterable) 会把 fn 应用在 iterable 的所有元素上，返回一个map object。

这样调用，跟用有回调函数的 map 来调用，是一样的。

map 也可以有不止一个 iterable。

比如，你要想计算一个简单线性函数 f(x)=ax+b 的均方误差 (MSE) ，两种方法就是等同的。

要注意的是，map 和 filter 返回的是迭代器 (Iterator) ，这就是说它们的值不是存储的，是按需生成的。

当你调用了sum(diffs) 之后，diffs 就空了。如果你想要保留 diffs 里面所有的元素，就用 list(diffs) 把它转换成一个列表。

filter(fn,iterable) 也是和 map 一样道理，只不过 fn 返回的是一个布尔值，filter 返回的是，iterable 里面所有 fn 返回True的元素。

reduce(fn,iterable,initializer) 是用来给列表里的所有元素，迭代地应用某一个算子。比如，想要算出列表里所有元素的乘积：

上面这串代码，和下面这串代码是等同的：

2、列表操作

小姐姐说，Python的列表太炫酷了。

2.1、解包 (Unpacking)

想把一个列表解包成一个一个元素，就这样：

也可以这样：

2.2、切片 (Slicing)

大家可能知道，如果想把一个列表反过来排，就用 [::-1] 。

而 [x:y:z] 这种语法的意思是，从索引x到索引y，每z个元素取一个。

如果z是负数，就是反向取了。

如果x不特别指定，就默认是在遍历列表的方向上，遇到的第一个元素。

如果y不特别指定，就默认是列表最后一个元素。

所以，我们要从一个列表里面，每两个取一个的话，就是 [::2] 。

也可以用这种方法，把一个列表里的偶数都删掉，只留奇数：

2.3、插入 (Insertion)

把列表里的其中一个元素的值，换成另一个值。

如果想把某个索引处的一个元素，替换成多个元素，比如把 1 换成 20, 30, 40 ：

如果想把3个值 0.2, 0.3, 0.5 插在索引0和索引1之间：

2.4、拉平 (Flattening)

如果，一个列表里的每个元素都是个列表，可以用sum把它拉平：

如果是嵌套列表 (Nested List) 的话，就可以用递归的方法把它拉平。这也是lambda函数又一种优美的使用方法：在创建函数的同一行，就能用上这个函数。

2.5、列表vs生成器

要想知道列表和生成器的区别在哪，看个例子：从token列表里面创建n-grams。

一种方法是用滑窗来创建：

]]

上面这个例子，是需要把所有n-gram同时储存起来的。如果文本里有m个token，内存需求就是 O(nm) 。m值太大的话，存储就可能成问题。

所以，不一定要用一个列表储存所有n-gram。可以用一个生成器，在收到指令的时候，生成下一个n-gram，这叫做惰性计算 (Lazy Evaluation) 。

只要让 ngrams 函数，用 yield 关键字返回一个生成器，然后内存需求就变成 O(n) 了。

还有一种生成n-grams的方法，是用切片来创建列表：[0, 1, …, -n], [1, 2, …, -n+1], …, [n-1, n, …, -1]，然后把它们zip到一起。

注意，创建切片用的是 (tokens[…] for i in range(n)) ，不是 [tokens[…] for i in range(n)] 。

[] 返回的是列表，() 返回的是生成器。

3、类，以及魔术方法

在Python里面，魔术方法 (Magic Methods) 是用双下划线，作为前缀后缀的。

其中，最知名的可能就是 _init_ 了。

        self.right = right

不过，如果想输出 (Print) 一个节点 (Node) ，就不是很容易了。

理想情况，应该是输出它的值，如果它有子节点的话，也输出子节点的值。

所以，要用魔术方法 _repr_ ，它必须返回一个可输出的object，如字符串。

如果想对比两个节点 (的各种值) ，就用 _eq_ 来重载 == 运算符，用 _lt_ 来重载 < 运算符，用 _ge_ 来重载 >= 。

想要了解更多魔术方法，请前往：
https://www.tutorialsteacher.com/python/magic-methods-in-python

或者使用官方文档，只是有一点点难读：
https://docs.python.org/3/reference/datamodel.html#special-method-names

这里，还要重点安利几种魔术方法：

一是 _len_ ：重载 len() 函数用的。
二是 _str_：重载 str() 函数用的。
三是 _iter_：想让object变成迭代器，就用这个。有了它，还可以在object上调用 next() 函数。

对于像节点这样的类，我们已经知道了它支持的所有属性 (Attributes) ：value、left和right，那就可以用 _slots_ 来表示这些值。这样有助于提升性能，节省内存。

        self.right = right

想要全面了解 _slots_ 的优点和缺点，可以看看Aaron Hall的精彩回答：
https://stackoverflow.com/a/28059785/5029595

4、局部命名空间，对象的属性

locals() 函数，返回的是一个字典 (Dictionary) ，它包含了局部命名空间 (Local Namespace) 里定义的变量。

>}

一个object的所有属性，都存在 _dict_ 里面。

注意，当参数列表 (List of Arguments) 很大的时候，手动把每个参数值分配给一个属性会很累。

想简单一点的话，可以直接把整个参数列表分配给 _dict_ 。

当object是用 kwargs** 初始化的时候，这种做法尤其方便 (虽然 kwargs** 还是尽量少用为好) ：

前4个版块就到这里了，至于第5个版块传授了怎样的技巧，先不介绍，大家可以从传送门前往观察：

https://github.com/chiphuyen/python-is-cool

宝藏小姐姐

贡献资源的Chip Huyen小姐姐，现在是英伟达的高级深度学习工程师了。

但在2015年进入斯坦福读书之前，她还是个没接触过深度学习的作家，旅行路上的故事已经出版了两本书。

△ 对，是个越南小姐姐

原本想读英文专业，却在选了一门计算机课之后，走上了深度学习的不归路。

喜欢就点「好看」吧 !

本篇文章来源于: 菜鸟学Python

本文为原创文章，版权归知行编程网所有，欢迎分享本文，转载请保留出处！

知行编程网关注：1 粉丝：1

这个人很懒，什么都没写

栗子发自凹非寺
量子位报道 | QbitAI

隐藏技巧五大类

1、Lambda、Map、Filter、Reduce函数

2、列表操作

3、类，以及魔术方法

4、局部命名空间，对象的属性

宝藏小姐姐

△ 对，是个越南小姐姐

内容反馈

你可能也喜欢

热评文章

发表评论

联系我们

标签云

推广返利

英伟达小姐姐的Python隐藏技巧合集，推特2400赞，代码可以直接跑

栗子 发自 凹非寺 量子位 报道 | QbitAI

隐藏技巧五大类

1、Lambda、Map、Filter、Reduce函数

2、列表操作

3、类，以及魔术方法

4、局部命名空间，对象的属性

宝藏小姐姐

△ 对，是个越南小姐姐

分享本文海报

内容反馈

你可能也喜欢

热评文章

发表评论

联系我们

标签云

推广返利

栗子发自凹非寺
量子位报道 | QbitAI