2023-10-01から1ヶ月間の記事一覧
# TL;DR 1. np.dotはBLASを呼び出すので、np.sumするよりnp.dotを使うほうが速い(float型に限る) 2. 条件付きでsumを取る場合は中間結果を保持する必要がないため更に速くなる
TL;DR PythonとNumPyだけで配列に対してelementwiseにbitcount処理を高速に行いたいよ 前計算したり、bit演算だけを使うアルゴリズムを使うとNumPyと相性よくそれなりに高速で動作したよ CuPy使うともっと速くなるよ、カーネル融合すると更に速くなるよ そも…