MulticoreCPUAccelerationCommand - juedaiyuer/researchNote GitHub Wiki
#多核CPU加速Linux命令#
计算非常大的数据
GUN Parallel命令
##BZIP2##
尤其是针对bzip2,GNU parallel在多核CPU上是超级的快。你一不留神,它就执行完成了
cat bigfile.bin | parallel --pipe --recend '' -k bzip2 --best > compressedfile.bz2
##GREP##
#原始操作
grep pattern bigfile.txt
#优化做法
cat bigfile.txt | parallel --pipe grep 'pattern'
#每个内核处理1千万行
cat bigfile.txt | parallel --block 10M --pipe grep 'pattern'
##AWK##
cat rands20M.txt | awk '{s+=$1} END {print s}'
cat rands20M.txt | parallel --pipe awk \'{s+=\$1} END {print s}\' | awk '{s+=$1} END {print s}'
##source##