@rg070836rg 2015-08-16T07:06:06.000000Z 字数 3361 阅读 1905

串的练习及一些思考

`data_structure`

一、strstr

1、题目概述

不调用C/C++的字符串函数，完成StrStr函数：把主串中子串及以后的字符全部返回。例如：主串是“12345678”，子串是“234”，那么函数的返回值就是“2345678”。

2、想法

刚看到这个题目，不由自主的想到了模式匹配，bf以及kmp。
与模式匹配的区别，就在于一个返回的是位置，一个返回的后面的串内容。
还是很好下手的。

由于在匹配里面需要用到字符串长度，先写了strlen函数,返回'/0'之前的数目

//函数返回字符串str 的长度( 即空值结束符之前字符数目)。
 int strlen(char *str)
 {
    int i=0,num=0;
    while (str[i++])
        num++;
    return num;
 }

最初的想法，通过BF算法找到匹配的位置，生成新的字符串，拷贝过去，并返回。如下：

//这是我最初的思想，通过bf算法找到匹配的位置，新生成字符串拷贝过去，并返回
char* strstr(const char *str1, const char *str2)
{
    int m=strlen(str1);
    int n=strlen(str2);
    char *a=new char[m]; 
    int i=0,j=0;
    while (i<m&&j<n)    
    {
        if(str1[i++]==str2[j++]);
        else
        {
            j=0;
            i=i-j+1;
        }
    }
    if (j>=n)
    {
        int k=0;
        int t=i-j;
        while (str1[t])
            a[k++]=str1[t++];
        a[k]='\0';
        return a;
    }
    else
        return "不匹配";
}

但后来想，没有必要拷贝新的空间，就在原始的字符串修改指针位置即可，如下：


//函数返回一个指针，它指向字符串str2 首次出现于字符串str1中的位置，如果没有找到，返回提示。
//当然还是基于BF算法
char* strstr_1( char *str1,  char *str2)
{
    int m=strlen(str1);
    int n=strlen(str2);
    int i=0,j=0;
    while (i<m&&j<n)    
    {
        if(str1[i++]==str2[j++]);
        else
        {
            j=0;
            i=i-j+1;
        }
    }
    if (j>=n)
    {
        return &str1[i-j];
    }
    else
        return "不匹配";
}

这样，就更加方便。测试一下：

    char a[20]="qweqwewqhello";
    char b[10]="he";
    cout<<strstr_1(a,b)<<endl;
    cout<<strstr(a,b)<<endl;

截图如下：
此处输入图片的描述

3、c实现

起始对于c语言的函数是怎么实现还是比较感兴趣的，于是搜索了下:

char* strstr(const char*s1,const char*s2)
{
    const char*p=s1;
    const size_t len=strlen(s2);
    for(;(p=strchr(p,*s2))!=0;p++)
    {
        if(strncmp(p,s2,len)==0)
            return(char*)p;
    }
    return(0);
}

这段代码中strchr的作用是查找字符串s中首次出现字符c的位置，strncmp之多比较n个字符，和strcmp类似

二、删除特定字符

用C语言编写一个高效率的函数来删除字符串里的给定字符。这个函数的调用模型如下所示：
void RemoveChars(char str[],char remove[]);
请对设计思路作出解释，并对你解决方案的执行效率进行评估

1、思路

一看到这个题目，第一个想法，就是暴力做，遍历第一个字符串，每次遍历时查找当前字符是否在第二个字符串中出现过

出现：删除该字符

没有出现过，保留该字符

那么按照这个思路，假设主串长m，子串长n，那么光遍历的时间复杂度就是O(mn);同时如果还需要删除，那么，需要把后面的全部都往前面移动，复杂度为O(m)级别,当然这个效率也还是很高的，特别是在子串长度不大的时候，效率接近线性。

恰巧，前几天在网上看了一篇有意思的文章，内容大概讲的就是，从武侠小说到程序员面试。这篇文章从武侠小说举例，讲述了程序员的几种境界，围绕使用C语言把字母转换成大写，不能使用库函数这个问题展开讨论，其中有这样的一段，很适合我们这里。

char to_upper(char input) 
{
  static char convert_table[] = { ... };
  return convert_table[input];
}

这样会调高程序的效率，在我们这边使用，效果会更加明显，我们预先把26个字母的结果存在数组里面，访问的时候，如果是1，则表明需要去除，否则不需要去除，这样这块就由O(n)变成了O(1)；

然后对于删除，我们可以用以前老师提到过的双指针，一个自始至终记录最后的结果，另一个遍历整个数组，这样，没有额外的开销。

2、实现

代码如下：

bool judge_table[128];
void RemoveChars(char *str,char *remove)
{
    memset(judge_table,false,sizeof(judge_table));
    while(*remove)
        judge_table[*(remove++)]=true;
    char* current;//遍历指针
    char* result;//结果指针
    current=result=str;
    while (*current)
    {
        if (judge_table[*current]==false)//说明这个字符不需要被删除，那么结果指针保存这个字符，并后移，遍历指针也后移
        {
            *result=*current;
            current++;
            result++;
        }
        else//需要被删除，遍历指针后移。
        {
            current++;
        }
    }
    *result='\0';
}

这样，效率控制在O(n)线性级别。

测试结果：
此处输入图片的描述

三、颠倒单词的顺序

1、思路

由题目看得到，整体句子被翻转了，而个体单词没有被翻转，如果是java中，用string类型的split方法，分离空格，倒序输出就好了，但是c++没有提供这样的方法。

那么，我们可以先整体倒序，包括各个单词的顺序，然后只需要找准空格，把空格之间的再次调用函数倒序即可，实现思想不难，但码代码的时候，要注意细节。。

2、实现

void reverse(char *start,char *end)
{ 
    char temp;
    while(start<=end)
    {
        temp=*start;
        *start=*end;
        *end=temp;
        start++;
        end--;        
    }
}
void reverseAll(char *str)
{     
    char *start=str;
    char *end=str+strlen(str)-1;
    reverse(start,end); //逆置整个句子
    //当没有到句子的末尾，找到空格，记录每个单词，逆置
    char *tmp=str;
    while (1)
    {
        while (*tmp!=' ')
        {
            tmp++;
            if (*tmp==0)//扫描到末尾，退出函数
            {
                end=tmp-1;
                reverse(start,end);
                return ;
            }
        }
        end=tmp-1;
        reverse(start,end);
        start=++tmp;
    }
}

此处输入图片的描述

四、查找包含个数

统计s中包含t的个数

1、分析

这个和模式匹配差不多，就是比模式匹配多了个找个数的过程，所以，我想到了，查到一个后，把剩下的传入继续查找，同时计数器加1，如果传进去的没有找到匹配的字符，那么说明，已经找完了，返回个数就可以了，实现也很简单，和模式匹配算法差不多。

2、代码实现

int countnum(char *str1,char *str2)
{
    int m=strlen(str1);
    int n=strlen(str2);
    int i=0,j=0;
    while (i<m&&j<n)    
    {
        if(str1[i]==str2[j])
        {
            i++;
            j++;
        }
        else
        {
            j=0;
            i=i-j+1;
        }
    }
    if (j>=n)
    {
        num++;
        countnum(&str1[i-j+n],str2);
    }
    else
        return num;
}

测试截图：
此处输入图片的描述

3、缺陷

但是有个明显的缺陷，比如主串是"aaaa",字串是"aa",这种情况很难界定。或许为了这种，可以把每次规模只缩小1，应该可以解决这个问题。。

串的练习及一些思考

data_structure

一、strstr

1、题目概述

2、想法

3、c实现

二、删除特定字符

1、思路

2、实现

三、颠倒单词的顺序

1、思路

2、实现

四、查找包含个数

1、分析

2、代码实现

3、缺陷

内容目录

选择主题

`data_structure`