[Topcoder SRM 467]均匀字符串Next…

题目：

http://cogs.pro/cogs/problem/problem.php?pid=1906

我们称一个字符串是“均匀的”，如果它每个长度为n的连续子串都包含不超过d个不同的字符。对于一个字符串seed和一个长整型整数k，定义k大均匀字符串为：所有和seed长度相同且字典序大于等于seed的均匀字符串中，按字典序从小到大，从0开始数的第k个。这里所说的字符串只包含小写字母。给出n,d,seed,k，你需要计算并输出k大均匀字符串。如果合法的字符串少于k+1个，输出空字符串。1<=d<=n<=9，|seed|<=50,0<=k<=10^18.

分析：

首先，看这个架势目测就是数位DP……那么问题来了，怎么DP呢？

我们先分析一下“逐位确定”的具体姿势：

首先确定答案的前多少位和seed相同。不妨设seed是”beef”，那么前三位和seed相同的字符串形如”beeX”，我们依次算出以”beef”,”beeg”,”beeh”……”beez”为开头的字符串有多少个（当然由于一共就四位，所以这里的答案不是0就是1），在过程中累加（累加的结果就是‘当前>=seed的字符串数量’）。然后再看前两位和seed相同的：依次算出以”bef”（并不是”bee”，最后一位是个特例，其他时候必须从seed的相应位+1处开始），”beg”,”beh”,……为开头的字符串有多少个。假设累加到”beo”时发现总数>=K，那就意味着答案串一定以“beo”开始！

然后再从前往后DP，逐位进行确定。依次算出”beoa”,”beob”,”beoc”……为开头的有多少个，并确定第四个字符，就像经典的数位DP那样。

（你可能会想到另外一种方法：先计算比seed小的有多少个，再计算类似‘第K小’的问题。但这样不行，因为比seed小的字符串数量有可能巨大，用longdouble之类会造成精度误差）

显然这一过程需要一个函数。不妨设其为calc(str,len)：以str为前缀，后面还有len位的均匀字符串数量。我一开始是想着进行二进制状态压缩（用0/1代表这一位上的字符在之前与没有出现过），但事实证明这样无法达到目的，因为只能从后向前而非从前向后转移。正确的方法是：开个hash存。我的方法是用一个unsigned来进行压缩：四个bit代表一个字符，共至多八个。将字符串缩减为最小表示法（例如，”beef”可以化简为”1123″），写成unsigned（实际就是把”1123″看作十六进制数）。但我们并不用0，这样就可以读出str的长度而非单独开一位存。对于0~50各开一张hash表f[i]，代表len=i的结果。事实证明hash表的长度开到大约一万就够了。用记忆化搜索就可以实现calc函数。

代码：

http://cogs.pro/cogs/submit/code.php?id=146723

（calc_less函数是用来卖萌的，不要在意）

发表回复 取消回复

发表回复取消回复