时间:2023-03-16 11:37:27 | 栏目:C代码 | 点击:次
排序是数据结构中很重要的一章,先介绍几个基本概念。
最坏:-----------O(N^2)
最好:-----------O(N)
平均:-----------O(N^2)
O(1)
稳定性:稳定
-『 插入排序 』:顾名思义就是把每一个数插入到有序数组中对应的位置。
就相当于你玩扑克牌的过程,抓来一张牌,就放在对应有序位置
直接插入排序:
当插入第i(i>=1)个元素时,前面的array[0],array[1],…,array[i-1]已经排好序,此时用array[i]的排序码与array[i-1],array[i-2],…的排序码顺序进行比较,找到插入位置即将array[i]插入,原来位置上的元素顺序后移
void InsertSort(int* a, int n) { for (int i = 0; i < n - 1; i++) { int x = a[end+1];//x为待排序的值 int end = i;//从end开始往前和x依次比较 while (end >= 0) { if (a[end] > x)//只要当前的值大于x继续往前找 { a[end+1] = a[end]; end--; } else { break;//跳出循环说明a[end] <= x } } a[end + 1] = x;//跳出循环说明a[end] <= x,需要把x插入到end前边 } }
那么我们可以看到,越是接近有序的数组,插入排序的效率越高(有序时对于任何一个数只需要和前边的数比较一次)。
O(n^(1.3—2))
O(1)
稳定性:稳定
『 希尔排序 』(Shell's Sort)是插入排序的一种又称“缩小增量排序”(Diminishing Increment Sort),是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。该方法因 D.L.Shell 于 1959 年提出而得名。
该方法实质上是一种『 分组插入 』方法,因为插入排序对于接近有序的数组排序效率非常高,那么希尔提出:
算法先将要排序的一组数按某个增量d分成若干组,每组中记录的下标相差d.对每组中全部元素进行排序,然后再用一个较小的增量对它进行分组,在每组中再进行排序。当增量减到1时,整个要排序的数被分成一组,排序完成。
一般的初次取序列的一半为增量,以后每次减半,直到增量为1。
并且插入排序可以看成分组是1的希尔排序。动图如下:
因为插入排序可以看做gap==1的希尔排序,因此只需要改变插入排序中for循环的增量控制排序即可。
void ShellSort(int* a, int n) { //按gap分组进行预排序 int gap = n; while (gap>1) { //gap = gap / 2; gap = gap / 3 + 1;//这里分组选每次折半或者/3都可以 for (int j = 0; j < gap; j++)//gap个组 for (int i = j; i < n - gap; i+=gap)//每个组从j开始每个增量gap { int end = i; int x = a[end + gap]; while (end >= 0) { if (a[end] > x) { a[end + gap] = a[end]; end -= gap; } else { break; } } a[end + gap] = x; } } }
关于希尔排序时间复杂度证明比较复杂,取决于gap怎么取,如果按照Knuth提出的/3,来取是O(n^(1.25)- 1.6*O(n^1.25).
希尔排序的特性总结:
最坏:-----------O(N^2)
最好:-----------O(N^2)
平均:-----------O(N^2)
O(1)
稳定性:不稳定
『 基本思想 』:
每一次从待排序的数据元素中选出最小(或最大)的一个元素,存放在序列的起始(末尾)位置,直到全部待排序的数据元素排完 。如图:
void SelectSort(int* a, int n) { int begin = 0; int end = n - 1; int mini = begin;//记录最小值下标 while (begin<end) { for (int i = begin; i < end; i++) { if (a[i] < a[mini]) { mini = i;//更新最小值下标 } } Swap(&a[mini],&a[begin]);//把最小值放到左边 ++begin;//左边对应起始位置++ } }
直接选择排序思考非常好理解,但是效率不是很好。实际中很少使用。
最坏:-----------O(N * logN)
最坏:-----------O(N * logN)
平均:-----------O(N*logN)
O(1)
堆排序(Heapsort)是指利用堆积树(堆)这种数据结构所设计的一种排序算法,它是选择排序的一种。它是通过堆来进行选择数据。需要注意的是排升序要建大堆,排降序建小堆。
具体可见另一篇文章堆排序和TopK问题
动图:
void Swap(int* px,int* py) { int t = (*px); (*px) = (*py); (*py)= t ; } void AdjustDown(int* a, int n, int parent) { int child = parent * 2 + 1; while (child < n) { if (child + 1 < n && a[child + 1] > a[child]) { child++; } if (a[child] > a[parent]) { Swap(&a[child], &a[parent]); parent = child; child = parent * 2 + 1; } else { break; } } } void HeapSort(int* a, int n) { for (int i = (n - 1 - 1) / 2; i >= 0; i--) { AdjustDown(a, n, i); } for (int i = n - 1; i > 0; i--) { Swap(&a[0], &a[i]); AdjustDown(a, i, 0); } }
最坏:-----------O(N^2)
最好:-----------O(N)
平均:-----------O(N^2)
O(1)
『 冒泡排序 』是大家最熟悉的也是最容易理解的排序,如下图:
『 冒泡排序基本思想 』就是每一次将相邻的数据进行『 两两比较 』,选出最大的依次比较送到右边,那么最右边就是最大值,而左边留下的自然就是小的(排升序)
-『 冒泡排序 』需要两层循环
『 内层循环 』表示一次冒泡,也就是两两比较先选出最大的放到最右边,同时注意每一次冒泡选出最大元素,那么两两比较次数-1(下一次不用比较选好的最右边)
『 外层循环 』控制的是冒泡的次数(假设数组N 个元素)也就是N-1次冒泡选出N-1个最大的元素
初版代码如下:
//初版: void Swap(int* px, int* py) { int t = (*px); *px = (*py); (*py) = t; } void BubbleSort(int* a, int n) { for (int i = 0; i < n-1; i++)//外层循环 { for (int j = 0; j < n-1-i; j++) { if(a[j]>a[j+1]) Swap(&a[j],& a[j + 1]);//交换 flag = 1; } } }
时间复杂度分析:每一次比较次数是N-1,N-2,N-3***1.因此是N(N-1)/2
但是这种写法还是有缺陷,时间复杂度永远是O(N^2) , 对于一个已经排好序的数组来说,还是需要N^2的复杂度,但对于有序的数组,每一次冒泡都不会进行交换因为有序,因此如果只要任何一次冒泡中没有数据交换就证明数组有序了。时间复杂度最好也可以达到0(N)。
代码优化如下:
//优化: void BubbleSort(int* a, int n) { for (int i = 0; i < n-1; i++) { int flag = 0; for (int j = 0; j < n-1-i; j++) { if(a[j]>a[j+1]) Swap(&a[j],& a[j + 1]); flag = 1; } if (flag == 0) break; } }
最坏:-----------O(N^2)
最好:-----------O(logN)
平均:-----------O(logN)
O(logN)
『 快速排序 』是Hoare于1962年提出的一种二叉树结构的交换排序方法,其『 基本思想 』为:任取待排序元素序列中的某元素作为『 基准值 』,按照该排序码将待排序集合分割成两子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后最左右子序列重复该过程,直到所有元素都排列在相应位置上为止。如图:
递归写法:
// 假设按照升序对a数组中[left, right)区间中的元素进行排序 void QuickSort(int* a, int left, int right) { if(right >= left ) return;//递归截止条件 // 按照基准值对a数组的 [left, right]区间中的元素进行划分 int keyi= partion(a, left, right); // 划分成功后以keyi为边界形成了左右两部分 [left, keyi-1] 和 [keyi+1, right] // 递归排[left, keyi-1] QuickSort(a, left, keyi-1); // 递归排[keyi+1, right] QuickSort(a, keyi+1, right); }
递归框架写完了接下来就差partion函数的实现也就是快排的灵魂,去每一次找基准值。那么一共有三种写法如下:
hoare版本
1.首先就是要找基准值,这里你可以选最左边或最右边的值(图中是6)
2.两个指针指向头(这里选左为基准值,头指针指向第二个)和尾,基准值选左,则右指针先走,反之左指针先走。
3.左指针找到比基准值大的停下,右指针找比基准值小的停下,交换左右指针指向值
4.重复2.3动作,直到左右指针相遇,交换左指针值和基准值
左值为基准,右指针先走找比6小的:
左值为基准,右指针先走找比6小的:
交换:
最终效果:相遇交换左指针和基准值,保证了6的左边都比6小,右边比6大。
并且除此之外,由于我们看到这种算法类似于二叉树的思想排好中间再排左右子树,因此我要保证选取的随机值尽量位与中位数。所以我们采取三数取中的方法。(选取最左值最右最中间的数的中位数)效率是可以提升5%到10%的。
//三数取中 int GetMidIndex(int* a, int left, int right) { //int mid = (left + right) / 2; //int mid = left + (right - left) / 2; int mid = left + ((right - left)>>1); if (a[left] < a[mid]) { if (a[mid] < a[right]) { return mid; } else if (a[left] > a[right]) { return left; } else { return right; } } else//a[left] > a[mid] { if (a[mid] > a[right]) { return mid; } else if (a[left] < a[right]) { return left; } else { return right; } } } int Partion(int* a, int left,int right) { int mini = GetMidIndex(a, left, right); Swap(&a[mini], &a[left]); int keyi = left; while (left < right) { while (left < right && a[right] >= a[keyi]) { right--; } while (left < right && a[left] <= a[keyi]) { left++; } Swap(&a[left], &a[right]); }Swap(&a[left], &a[keyi]); return left; }
挖坑法
挖坑法就是对hoare版本的一种变形,过程如下:
初始如下:先保存基准值,基准值形成一个坑位!
左为基准,右指针先走,找到小的送到坑位,那么此刻右指针形成了新的坑位
左指针出动,找到大的继续送到坑位,左指针形成了新的坑位
指针相遇,把6写入。也保证左边比6小,右边比6大。代码如下:
//挖坑法 int Partion2(int* a, int left, int right) { int mini = GetMidIndex(a, left, right); Swap(&a[mini], &a[left]); int key = a[left]; int pivot = left; while (left < right) { //右边先找小 while (left< right && a[right] >= key) { --right; } a[pivot] = a[right]; pivot = right; while (left < right && a[left] <= key) { ++left; } a[pivot] = a[left]; pivot = left; } a[pivot] = key; return pivot; }
前后指针版本
顾名思义,使用两个指针,这里选取左为基准值为例,两个指针从左开始出发一个cur,一个prev。
要求:
cur指针先走,一旦找到比基准值小的就停下,++prev,并交换。
cur指针一直到头为止,最后交换prev指向值和基准值
1和2都比6小cur走一步停一步,prev++并交换,指向相等。
cur越过7和9去找小的3,此时停下,prev++指向7交换。(我们注意到prev和cur不等时prev永远是去找大的,cur是找小的,因此交换就做到把cur指向的小的往前扔,大的往后仍,)
整个过程如上,代码:
//前后指针法 int Partion3(int* a, int left, int right) { int mini = GetMidIndex(a, left, right); Swap(&a[mini], &a[left]); int prev = left, cur = left+1; int keyi = left; while (cur<=right) { if (a[cur] < a[keyi] && ++prev !=cur) { Swap(&a[prev], &a[cur]); } cur++; } Swap(&a[prev], &a[keyi]); return prev; }
小结
递归版本三种方法如上,但是递归毕竟有缺陷,就是需要不断开辟栈帧,当数据量超过10W以上时就会有栈溢出的风险。
并且递归类似二叉树的结构越往下递归调用越多,栈帧翻倍开辟,因此我们还可以去优化一下,就是当递归到左右区间比较小时,我们去控制剩下的排序用别的排序来代替它。
//优化: void QuickSort(int* a, int left, int right) { if (left >= right) return; if (right - left + 1 < 10) { //小区间优化 InsertSort(a + left , right - left + 1); } else { int keyi = Partion3(a, left, right); QuickSort(a, left, keyi - 1); QuickSort(a, keyi + 1, right); } }
非递归:
非递归版本就是改变了快排的框架,用一个栈和循环来代替递归实现。依次将左右下标入栈出栈(出栈之前排序)来模拟递归。
void QuickSortNonR(int* a, int left, int right) { Stack st;//定义一个栈 StackInit(&st);//初始化 StackPush(&st, left);//左下标入栈 StackPush(&st, right);//右下标入栈 while (StackEmpty(&st)!=0) { int end = StackTop(&st);//获取栈顶元素即后入栈的右下标 StackPop(&st);//出栈 int begin = StackTop(&st);//获取栈顶元素即先入栈的左下标 StackPop(&st);//出栈 int keyi = Partion3(a, begin, end); if (keyi + 1 < end)//相当于递归左半部分 { StackPush(&st, keyi + 1); StackPush(&st, right); } if (keyi - 1 > begin)//相当于递归右半部分 { StackPush(&st, keyi - 1); StackPush(&st, begin); } } }
最坏:-----------O(NlogN)
最好:-----------O(NlogN)
平均:-----------O(NlogN)
O(N)
稳定性:稳定
基本思想:
归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide andConquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。 动图演示:
归并的思想就是把先假设数组分成两个有序,对其进行筛选排序,如上图:
但是问题来了我们怎么保证数组是有序的?因此就要求我们从小区间开始对数组归并排序,对于上图中的数据,先对开始3和3归并,小的先进入到tmp数组,因此前两个就是有序,再对,5和6归并,5,6有序后,在归并3,3,5,6……以此类推
递归写法
框架:
void MergeSort(int* a,int n) { int* tmp = (int*)malloc(sizeof(int) * n);//开辟N个大小数组 if (tmp == NULL) { exit(-1); } _MergeSort(a, 0, n - 1, tmp);//进行归并操作 free(tmp); tmp = NULL; }
归并排序:
运用递归先不断缩小偏序区间,在递归层层退出时一遍退出,一边对不断回大的区间归并排序:
void _MergeSort(int* a, int left, int right,int* tmp) { if (left >= right) { return;//递归截止条件left >= right区间中数的个数<=0个 } int mid = left + (right - left) / 2;//取中 _MergeSort(a, left, mid, tmp);//对左区间递归 _MergeSort(a, mid+1, right, tmp);//对右区间递归 int begin1 = left, end1 = mid;//左区间 int begin2 = mid+1, end2 = right;//右区间 int i = left; while (begin1 <= end1 && begin2 <= end2) { if (a[begin1] < a[begin2]) { tmp[i++] = a[begin1++]; } else { tmp[i++] = a[begin2++]; } } while (begin1 <= end1 ) { tmp[i++] = a[begin1++]; } while (begin2 <= end2) { tmp[i++] = a[begin2++]; } for (size_t i = left; i <= right; i++) { a[i] = tmp[i];//把排好序[left,right]的tmp赋值给原数组 } }
非递归
非递归的不同就是需要手动控制区间大小,也就是不断2倍扩大区间归并。
但是还需要注意就是当下标是奇数,无法分成整数个组的时候,需要考虑剩余的数,以及是否越界的问题
void MergeSortNonR(int* a, int n) { int* tmp = (int*)malloc(sizeof(int) * n); if (tmp == NULL) { exit(-1); } int gap = 1; while (gap < n) { for (int i = 0; i < n; i += 2 * gap) { //[i][i+gap-1] [i+gap][i+2*gap-1] int begin1 = i, end1 = i + gap-1; int begin2 = i + gap, end2 = i + 2 * gap - 1; int index = i; if (end1 >= n || begin2 >= n) { break; } if (end2 >= n) { end2 = n - 1; } while (begin1<=end1 && begin2<=end2) { if (a[begin1] <= a[begin2]) { tmp[index++] = a[begin1++]; } else { tmp[index++] = a[begin2++]; } } while (begin1 <= end1) { tmp[index++] = a[begin1++]; } while (begin2 <= end2) { tmp[index++] = a[begin2++]; } //控制越界问题三种情况 if (end1 >= n) { end1 = n - 1; } if (end1 >= n) { end1 = n - 1; } if (end1 >= n) { end1 = n - 1; } for (int j = i; j <= end2; j++) { a[j] = tmp[j]; } } gap *= 2; } free(tmp); tmp = NULL; }
最坏:-----------O(MAX(N,范围))
最好:-----------O(MAX(N,范围))
平均:-----------O(MAX(N,范围))
O(范围)
稳定性:不稳定
思想:计数排序又称为鸽巢原理,是对哈希直接定址法的变形应用。 操作步骤:
动图如下:
类似桶排序的思想,如上图,先开辟数组统计数组中某一个数出现的次数,比如2出现1次,3出现两次,那么我们直接按顺序读入开辟的数组,在原数组写1一个2,两个3以此类推……
void CountSort(int* a, int n) { int max=a[0], min= a[0]; for (int i = 0; i < n; i++) { if (a[i] > max) { max = a[i]; } if (a[i] < min) { min = a[i]; } } int range = max - min + 1; int* count = (int*)malloc(sizeof(int) * range); memset(count, 0, sizeof(int)*range); for (int i = 0; i < n; i++) { count[a[i] - min]++; } int j = 0; for (int i = 0; i < range; i++) { while (count[i]--) { a[j++] = i + min; } } }
计数排序的特性总结:
计数排序在数据范围集中时,效率很高,但是适用范围及场景有限。
1. 复杂度总结
2. 性质分类