Taichi 计算加速

2023-04-25 02:06:31 +08:00
 wizardyhnr

无意间发现 Taichi 计算加速还挺快的。官网例子如下。不知道更复杂的案例效果怎么样。

#!/usr/bin/env python
#prime_taichi.py
import taichi as ti
ti.init(arch=ti.gpu)
@ti.func
def is_prime(n: int):
    result = True
    for k in range(2, int(n ** 0.5) + 1):
        if n % k == 0:
            result = False
            break
    return result

@ti.kernel
def count_primes(n: int) -> int:
    count = 0
    for k in range(2, n):
        if is_prime(k):
            count += 1

    return count
#!/usr/bin/env python
#test.py
"""Count the prime numbers in the range [1, n]
"""
from prime_taichi import count_primes
import time

start: int = time.time()
print(count_primes(10000000))
print(time.time()-start)

#Taichi 版本,笔记本 2070S

[Taichi] version 1.5.0, llvm 15.0.4, commit 7b885c28, linux, python 3.10.6
[Taichi] Starting on arch=cuda
664579
0.20201754570007324

#纯 Python 版本

664579
83.8845808506012
1749 次点击
所在节点    Python
5 条回复
dayeye2006199
2023-04-25 02:20:26 +08:00
这个和 numba 之类的是否有相似之处?
wizardyhnr
2023-04-25 02:38:19 +08:00
都是 JIT 加速,性能好像比 numba 好不少。
file:///dev/shm/performance-comparisons-for-python-libraries-in-parallel-computing-and-physical-simulation-1.pdf
https://docs.taichi-lang.org/blog/taichi-compared-to-cub-cupy-numba
huoshen
2023-04-25 02:46:06 +08:00
Taichi 是能加速, 因为运行的时候不是 python 了, 是他编译的静态语言, 但限制挺多的, 有些不支持递归, 有的不支持嵌套, 有的并行运行, 会导致额外的非原子内存操作导致数据不一致. 想额外吐槽一下 Taichi, 这学期上的一个 CG 课, 教授指定用的就是 Taichi, 官网上文档都不全, 然后各种 Machine dependent bug 搞得我心态都快炸了.
t133
2023-04-25 08:42:07 +08:00
taichi 跟 jax 哪个快有没有都用过的
oldshensheep
2023-04-25 14:23:14 +08:00
怎么不试试神奇的 GraalVM ,用 GraalVM 直接运行 Python 文件:
664579
8.049000024795532
用 CPython 运行:
664579
115.89525604248047
GraalVM 不能使用 GPU 加速,实验在甲骨文的 ARM 服务器上运行,快了十几倍
优点就是不用改代码,不过不能使用 GPU

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/935210

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX