引言
首先看一道题目:有一个大小为100的数组,里面的元素是从 1 到 100,随机从数组中选择50个不重复数。
用 Math.random() * 100 ,就可以拿到一个 0 到 99 的随机数,是不是重复50次就可以了?
当然不是,假如,第一次随机到5,第二次如果再一次随机到5的话,要求是选择不重复的数,所以要选出50个不重复的数的话,随机次数远远大于50,因为越到后面随机到的数与前面选出的数重复的概率越大。
怎么解决呢?大家都玩过或见过发牌,54张牌,发一张牌,发牌人手里就少一张,直至将所有牌都发完。
同样上面的问题也可以这样解决,第一次随机到一个数后,将这个数取出来,再从剩下的99个数字里随机取出第二个数,这样随机50次取出的书就不会重复,这就是今天的主题:洗牌算法
洗牌算法
Fisher-Yates洗牌算法是由 Ronald A.Fisher和Frank Yates于1938年发明的,后来被Knuth在书中介绍,很多人直接称Knuth洗牌算法, Knuth大家应该比较熟悉,《The Art of Computer Programming》作者,算法理论的创始人。
我们现在所使用的各种算法复杂度分析的符号,就是他发明的。
等概率:洗牌算法有些人也称等概率洗牌算法,其实发牌的过程和我们抽签一样的,大学概率论讲过抽签是等概率的,同样洗牌算法选中每个元素是等概率的。
用洗牌算法思路从1、2、3、4、5这5个数中,随机取一个数
第一次随机抽取到4这个元素
4被抽中的概率是1/5
第二次随机抽取到5这个元素
5被抽中的概率是1/4*4/5=1/5
第三次随机抽取到2这个元素
2被抽中的概率是1/3*3/4*4/5=1/5
第四次随机抽取到1这个元素
1被抽中的概率是1/2*1/3*3/4*4/5=1/5
第五次随机抽取到3这个元素
3被抽中的概率是1*1/2*1/3*3/4*4/5=1/5
时间复杂度为O(n*n),空间复杂度为O(n)
算法思路:
在上面的介绍的发牌过程中, Knuth 和 Durstenfeld 在Fisher 等人的基础上对算法进行了改进,在原始数组上对数字进行交互,省去了额外O(n)的空间。
该算法的基本思想和 Fisher 类似,每次从未处理的数据中随机取出一个数字,然后把该数字放在数组的尾部,即数组尾部存放的是已经处理过的数字。
在54张牌中随机选一张,将这张牌与第一张交换顺序
在剩下的53张中继续随机选取一张与第二张牌进行交换
直至最后一张。
时间复杂度为O(n),空间复杂度为O(1),缺点必须知道数组长度n。
代码:
洗牌算法生成雷区:
将排列好的雷,用洗牌算法打乱生成雷区图
生成的雷区图:
“传统企业授信业务往往面临审批材料多、尽调时间长的痛点,通过大语言模型搭载的音频分析、图像处理等功能,我们实现了语音、扫描件等文件的自动提取,打破不同信息载体间的壁垒,大大减少了尽调材料采集、贸易背景审核、合同质检等环节的重复性工作。”据江苏银行工作人员介绍,在大语言模型的加持下,该行依托大语言模型优势,不断优化信贷业务流程,激发“效率革命”,减少手工操作的繁琐,充分释放一线生产力。
算法Knuth数组概率复杂度发布于:四川省声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。