CDQ分治

不得不说

本来标题想写分治,但是想了想发现自己分治能说的不多,主要的内容就是$CDQ$分治.便取了这个标题.

预备知识

关于什么是分治
分治，字面上的解释是“分而治之”，就是把一个复杂的问题分成两个或更多的相同或相似的子问题，再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解，原问题的解即子问题的解的合并。在计算机科学中，分治法就是运用分治思想的一种很重要的算法。分治法是很多高效算法的基础，如排序算法（快速排序，归并排序），傅立叶变换（快速傅立叶变换）等等。
一般步骤

划分步：把输入的问题划分为$k$个子问题，并尽量使这$k$个子问题的规模大致相同。
治理步：当问题的规模大于某个预定的阈值$n_0$时，治理步由$k$个递归调用组成。
组合步：组合步把各个子问题的解组合起来，它对分治算法的实际性能至关重要，算法的有效性很大地依赖于组合步的实现。

时间复杂度
- 直观估计
  - 分治由以上三部分构成，整体时间复杂度则由这三部分的时间复杂度之和构成.
  - 由于递归，最终的子问题变得极为简单，以至于其时间复杂度在整个分治策略上的比重微乎其微.
经典例题
- 归并排序,快排等
- 求逆序对等
  经典例题
  $Atcoder\ A\ -\ Colorful\ Subsequence$
  https://atcoder.jp/contests/agc031/tasks/agc031_a
题目简析:
- 问多少种子序列,子序列中的字母不同.
- 列如$baa$,包括:$b,a,a,$两个不同位置$a$的$ba$,总计$5$个,$baa$排除是因为$a$是重复的.

解法

先将每个字母的个数统计下来,然后分治计算,一个字母的时候,答案是该字母出现的次数.
只有两个字母的时候,如$ab$,包含的排列有$a,b,ab$,相当于’$a$的个数,$b$的个数,$a$和$b$组合个数’的加和,而$a$和$b$组合个数,则是$a$的个数$\times b$的个数

同理可得,$ans$即为$ansL+ansR+ansL\times ansR$.

#include<iostream>
#include<algorithm>
#include<string>
#include<queue>
#include<stdio.h>
#include<stdlib.h>
#ifndef null
#define null -1
#endif
using namespace std;

const int MAXN = 2e5 + 10;
const int INF = 1e5 + 10;
const int MOD = 1e9 + 7;
typedef long long ll;

char s[INF];
int num[27];
string s1="0";
ll solve(int L, int R)
{
    if (L == R)
        return num[s1[L] - 'a'];
    int mid = (L + R) >> 1;
    ll nL = solve(L, mid), nR = solve(mid + 1, R);
    return (nL%MOD + nR%MOD + (nL%MOD * nR%MOD)%MOD)%MOD;
}
int main()
{
    int n;
    cin >> n >> s;
    for (int i = 0; i < n; i++) {
        if (!num[s[i] - 'a'])
            s1 = s1 + s[i];
        num[s[i] - 'a']++;
    }

    cout << solve(1, s1.length() - 1)<<endl;

    return 0;
}

CDQ分治

前面絮絮叨叨的简单介绍了下分治,想必各位对分治有了一定认识.
下面是重头戏:$CDQ$分治.
这个算法,是由陈丹琦大牛在论文中提出的%%%.
首先,我们需要知道一些事情:

优势在于可以顶替复杂的高级数据结构，而且常数比较小
缺点在于必须离线操作

用来解决什么问题呢?

首先,分治问题2333
分治后的答案,不仅单单考虑子问题${L,mid}$和子问题${mid+1,R}$.
还需要考虑子问题${L,mid}$对子问题${mid+1,R}$的影响$/$联系产生的答案.

列如:

二维偏序问题
- 给定一个二元组${x,y}$,要求问有多少对${x_i,y_i},{x_j,y_j}$满足$x_i>x_j$&&$y_i>y_j$
- 解法为:
  - 先将二元组按照$x$的大小排列.
  - 分治后,我们分别知道${L,mid}$区间和${mid+1,R}$区间内的解
  - 再计算跨过$mid$的两对点,对${L,mid}$和${mid+1,R}$中的二元组按照$y$的大小排序
  - 由于先前分组便已经对$x$进行排序,所以,只需要二分便可以求得左区间相对于右区间的点的个数.
三维偏序问题
- 和二维偏序问题类似,但有一定不同
- 给定一个三元组${x,y,z}$,要求问有多少对${x_i,y_i,z_i},{x_j,y_j,z_j}$满足$x_i>x_j$&&$y_i>y_j$&&$z_i>z_j$
- 解法为:
  - 先将三元组按照$x$的大小排列.
  - 分治后,我们分别知道${L,mid}$区间和${mid+1,R}$区间内的解
  - 再计算跨过$mid$的两对点,对${L,mid}$和${mid+1,R}$中的三元组按照$y$的大小排序
  - 由于先前分组便已经对$x$进行排序,所以,只需要二分便可以求得满足$y$条件的点.
  - 再建立一个权值树状数组$/$线段树,再将上面符合的${x,y,z}$对应中满足不等式的$z$的点求出.

例题

BZOJ3262: 陌上花开
BZOJ4237: 稻草人或者这个LibreOJ稻草人

伪代码

void cdq(int left,int right)
{
    if(left==right)
        return ;
    int mid=(left+right)>>1;
    cdq(left,mid),cdq(mid+1,right);
    sort(a+l,a+mid+1,cmp);
    sort(a+mid+1,a+right+1,cmp);
    
    /**
    *处理左区间对于右区间影响的代码
    */

例题:稻草人

问题简述

链接
https://loj.ac/problem/2880

给定$n$个稻草人（横纵坐标是不大于$10^9$的非负整数且两两$x,y$都不相同）
求有多少个矩形满足：

边平行于横、纵轴
左下角、右上角都是给定的稻草人

内部不包含其它稻草人

解析

$Step\ 1.{\ }$
首先考虑,如果无视第三条,那么,该题变为了什么?
给定二元组集合,$A={x,y}$,那么对于任何${x_i,y_i}$,${x_j,y_j}$,问有多少对点满足:$y_j>y_i$&&$x_j>x_i$
对于这样的一个式子,我们很容易得到两种解法,第一种:树状数组/万能的线段树.第二种:$cdq$分治.当然,本蒟蒻选择第二种.~~(为什么?树状数组咱还没学,线段树不会使)~~
然后呢,$cdq$分治的标准操作为?

void solve(int left, int right)
{
    if (left == right)
        return;
    int mid = (left + right) >> 1;
    solve(left, mid), solve(mid+1 , right);//分治处理左半边和右半边
    /**
    *处理两边关系的代码
    */
}

~~好的,本题完结~~

$Step\ 2.{\ }$
于是,我们加上条件三.
如何处理两边点之间的关系?
对于左半边,我们假设右半边的点都是符合条件的.

我们可以知道,如果左半边的一个点$A$是符合条件的,那么答案$ans+=$右半边对于$A$符合条件的点.
我们在左半边加入$B$点,若$B$点的存在是与$A$点不冲突的,那么答案$ans+=$右半边对于$B$符合条件的点.
若,$B$点与$A$点的存在有矛盾,即不符合条件三,列如$x_b<x_a,y_b>y_a$这种情况,我们应:将$A$点对应的值删去,加入右半边对于$B$符合条件的点

$Step\ 3.{\ }$
结合$Step\ 1$和$Step\ 2$.我们已知的有:
假设我们是对$x$按照从小到大排序的,即对点按照$x$离散化后.

我们知道,左边的$x$必定小于右边的$x$.
我们要按照y的大小对左右分别排序.
对于右边,我们要维护一个按照$x$单调递增的单调栈.(即按照$y$递减)
对于左边,我们要维护一个按照$x$单调递减的单调栈.(即按照$y$递增)
每次左边新增一个$i$点,我们都要让答案$ans+=$右边维护的单调栈长度.答案$ans-=$右边比$y_i$小的点.
我们知道单调栈是单调的….嗯,所以对于寻点,我们可以二分查找.

分析结束,综上,细节请参阅分治的代码来理解,手动模拟一遍就非常明了了.

来自LibreOJ的数据,非常适合模拟
输入
10
2 1
3 0
6 3
10 2
16 4
0 8
8 12
11 14
14 11
18 10
输出
15
示例图:

代码

#include<iostream>
#include<algorithm>
#include<string>
#include<queue>
#include<stdio.h>
#include<stdlib.h>
#ifndef null
#define null -1
#endif
using namespace std;

const int MAXN = 2e5 + 10;
const int INF = 1e9 + 10;
typedef long long ll;

struct vec {
    int x, y,len;
}tp[MAXN];
int q_R[MAXN], q_L[MAXN], n,tail_L, tail_R;
ll ans = 0;

bool cmpx(vec a, vec b)
{
    return a.x < b.x;
}

bool cmpy(vec a, vec b)
{
    return a.y > b.y;
}

int find(int y)
{
    int left= 1, right= tail_R, mid=(left + right) >> 1;
    while(left < right){
        if (tp[q_R[mid]].y < y)
            right = mid;
        else
            left = mid + 1;
        mid = (left + right) >> 1;
    }
    if (!tail_R || tp[q_R[left]].y < y)
        left--;
    return left;
}
    
void solve(int left, int right)
{
    if (left == right)
        return;
    int mid = (left + right) >> 1;
    solve(left, mid), solve(mid+1 , right);
    sort(tp+left, tp + mid+1, cmpy);
    sort(tp + mid + 1, tp + right + 1, cmpy);

    int i = left, j = mid + 1;
    tail_L = tail_R = 0;
    while (i <= mid && j <= right)
        if (tp[i].y > tp[j].y) {
            while(tail_L > 0 && tp[q_L[tail_L]].x < tp[i].x)
                tail_L--;
            ans += tail_R;
            if (tail_L > 0)
                ans -= find(tp[q_L[tail_L]].y);
            q_L[++tail_L] = i;
            i++;
        }
        else {
            while(tail_R > 0 && tp[q_R[tail_R]].x > tp[j].x)
                tail_R--;
            q_R[++tail_R] = j;
            j++;
        }
    for (; i <= mid; i++) {
        while(tail_L > 0 && tp[q_L[tail_L]].x < tp[i].x)
            tail_L--;
        ans += tail_R;
        if (tail_L > 0)
            ans -= find(tp[q_L[tail_L]].y);
        q_L[++tail_L] = i;
    }
}

int main()
{
    cin >> n;
    for (int i = 1; i <= n; i++)
        cin >> tp[i].x >> tp[i].y;
    sort(tp+1, tp + n+1, cmpx);
    
    solve(1, n);

    cout<< ans << endl;

    //system("pause");
    return 0;
}

不得不说

预备知识

经典例题

CDQ分治

伪代码

例题:稻草人

问题简述

解析

代码