STAGの備忘録

みんなブログを書いている、書いていないのは俺だけ

2023-10-01から1ヶ月間の記事一覧

np.sumよりnp.dotするほうが速い

# TL;DR 1. np.dotはBLASを呼び出すので、np.sumするよりnp.dotを使うほうが速い(float型に限る) 2. 条件付きでsumを取る場合は中間結果を保持する必要がないため更に速くなる

NumPyを用いた配列に対するelementwiseなbitcountの実装

TL;DR PythonとNumPyだけで配列に対してelementwiseにbitcount処理を高速に行いたいよ 前計算したり、bit演算だけを使うアルゴリズムを使うとNumPyと相性よくそれなりに高速で動作したよ CuPy使うともっと速くなるよ、カーネル融合すると更に速くなるよ そも…