DNA Sorting
1007 DNA 排序
题目大意:
序列“未排序程度”的一个计算方式是元素乱序的元素对个数。例如:在单词序列“DAABEC'”中,因为D大于右边四个单词,E大于C,所以计算结果为5。这种计算方法称为序列的逆序数。序列“AACEDGG”逆序数为1(E与D)——近似排序,而序列``ZWQM'' 逆序数为6(它是已排序序列的反序)。
你的任务是分类DNA字符串(只有ACGT四个字符)。但是你分类它们的方法不是字典序,而是逆序数,排序程度从好到差。所有字符串长度相同。
输入:
第一行包含两个数:一个正整数n(0<n<=50)表示字符串长度,一个正整数m(0<m<=100)表示字符串个数。接下来m行,每行一个长度为n的字符串。
输出:
输出输入字符串列表,按排序程度从好到差。如果逆序数相同,就原来顺序输出。
样例输入:
10 6
AACATGAAGG
TTTTGGCCAA
TTTGGCCAAA
GATCAGATTT
CCCGGGGGGA
ATCGATGCAT
样例输出:
CCCGGGGGGA
AACATGAAGG
GATCAGATTT
ATCGATGCAT
TTTTGGCCAA
TTTGGCCAAA
今天被这道题目坑了一天,唉,说多了全是泪,但还是要说的,免得广大程序猿同志跟我一样,其实这道题目不是很难,我设计的程序也没有错误,只是POJ网站不支持某些库函数而已,所以,在做这些题目的时候,不要轻易使用类似 fflush() 之类的函数,今天我一整天检查不出bug就是因为这个 fflush()。
虽然简单,还是大概说一下思路吧:
1、纯粹使用数组来实现比较麻烦,当然也是可以实现的,我的第一个程序就是用数组实现的,选取的数据结构为:
typedef struct { int DNAnum; char str[52]; }NodeDNA;
2、计算每个字符串的逆序数,根据题意来计算即可;
int DNAcount(char* destination, int len) { /* 统计每个字符串的DNA值 */ int iterX = 0; int iterY = 0; int cnt = 0; for(iterX = 0; iterX < len - 1; iterX++) { if(destination[iterX] == 'A') { continue; } for(iterY = iterX + 1; iterY < len; iterY++) { if(destination[iterX] > destination[iterY]) { cnt++; } } } return cnt; }
字符串里面假设有字母 'A' ,是可以直接跳过的,因为字母 'A' 不影响逆序数,所以,程序才加入了if语言来判断;
3、接下来就是对逆序数排序了,可以采用直接货冒泡排序,快速排序,这两种排序我都试过,没有超出时间要求,不过快速排序不用自己写,直接调用qsort()函数即可;下面贴出完整代码
#include <stdio.h> #include <stdlib.h> typedef struct { int DNAnum; char str[52]; }NodeDNA; int DNAcount(char* destination, int len) { /* 统计每个字符串的DNA值 */ int iterX = 0; int iterY = 0; int cnt = 0; for(iterX = 0; iterX < len - 1; iterX++) { if(destination[iterX] == 'A') { continue; } for(iterY = iterX + 1; iterY < len; iterY++) { if(destination[iterX] > destination[iterY]) { cnt++; } } } return cnt; } int cmp(const void* a,const void* b) { NodeDNA* x=(NodeDNA*)a; NodeDNA* y=(NodeDNA*)b; return (x -> DNAnum) - (y -> DNAnum); } int main(void) { NodeDNA NoDNA[101]; int col = 0; int row = 0; int iter = 0; //scanf("%d%d", &col, &row); //fflush(stdin); while( scanf("%d%d", &col, &row) != EOF ) { getchar(); for(iter = 0; iter < row; iter++) { gets(NoDNA[iter].str); NoDNA[iter].DNAnum = DNAcount(NoDNA[iter].str, col); } qsort(NoDNA, row, sizeof(NodeDNA),cmp); for(iter = 0; iter < row; iter++) { puts(NoDNA[iter].str); } } return 0; }
另外,需要说明的一点是,计算逆序数的还有一个复杂度为O(n)的算法;
int InversionNumber(char* s,int len) { int ans=0; //s逆序数 int A, C, G , i; //各个字母出现次数 A = C = G = 0; for( i = len-1;i >= 0;i--) { switch(s[i]) { case 'A':A++;break; //A是最小的,无逆序数 case 'C': { C++; ans+=A; //当前C后面出现A的次数就是这个C的逆序数 break; } case 'G': { G++; ans+=A; ans+=C; break; } case 'T': { ans+=A; ans+=C; ans+=G; break; } } } return ans; }