[Topcoder SRM 467]均匀字符串Next…

题目:

我们称一个字符串是“均匀的”,如果它每个长度为n的连续子串都包含不超过d个不同的字符。对于一个字符串seed和一个长整型整数k,定义k大均匀字符串为:所有和seed长度相同且字典序大于等于seed的均匀字符串中,按字典序从小到大,从0开始数的第k个。这里所说的字符串只包含小写字母。给出n,d,seed,k,你需要计算并输出k大均匀字符串。如果合法的字符串少于k+1个,输出空字符串。1<=d<=n<=9,|seed|<=50,0<=k<=10^18.
分析:
首先,看这个架势目测就是数位DP……那么问题来了,怎么DP呢?
我们先分析一下“逐位确定”的具体姿势:
首先确定答案的前多少位和seed相同。不妨设seed是”beef”,那么前三位和seed相同的字符串形如”beeX”,我们依次算出以”beef”,”beeg”,”beeh”……”beez”为开头的字符串有多少个(当然由于一共就四位,所以这里的答案不是0就是1),在过程中累加(累加的结果就是‘当前>=seed的字符串数量’)。然后再看前两位和seed相同的:依次算出以”bef”(并不是”bee”,最后一位是个特例,其他时候必须从seed的相应位+1处开始),”beg”,”beh”,……为开头的字符串有多少个。假设累加到”beo”时发现总数>=K,那就意味着答案串一定以“beo”开始!
然后再从前往后DP,逐位进行确定。依次算出”beoa”,”beob”,”beoc”……为开头的有多少个,并确定第四个字符,就像经典的数位DP那样。
(你可能会想到另外一种方法:先计算比seed小的有多少个,再计算类似‘第K小’的问题。但这样不行,因为比seed小的字符串数量有可能巨大,用longdouble之类会造成精度误差)
显然这一过程需要一个函数。不妨设其为calc(str,len):以str为前缀,后面还有len位的均匀字符串数量。我一开始是想着进行二进制状态压缩(用0/1代表这一位上的字符在之前与没有出现过),但事实证明这样无法达到目的,因为只能从后向前而非从前向后转移。正确的方法是:开个hash存。我的方法是用一个unsigned来进行压缩:四个bit代表一个字符,共至多八个。将字符串缩减为最小表示法(例如,”beef”可以化简为”1123″),写成unsigned(实际就是把”1123″看作十六进制数)。但我们并不用0,这样就可以读出str的长度而非单独开一位存。对于0~50各开一张hash表f[i],代表len=i的结果。事实证明hash表的长度开到大约一万就够了。用记忆化搜索就可以实现calc函数。
代码:
(calc_less函数是用来卖萌的,不要在意)

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注