2020年7月

0	1	2	3	4	5	6	7	8	9
a	b	c	d	e

0	1	2	3	4	5	6	7	8	9
f	a	b	c	d	e

0	1	2	3	4	5	6	7	8	9
f	a	b	g	c	d	e

0	1	2	3	4	5	6	7	8	9
f	a	b	g	c	d	e	h

0	1	2	3	4	5	6	7	8	9
a	b	g	c	d	e	h

0	1	2	3	4	5	6	7	8	9
a	b	g	c	e	h

C++ 的一些让人烦的语法小特性

作者: sprite
时间: 2020-07-28
分类: 笔记,C++
评论

C++在使用的时候莫名的会出一些编译错误，有时候只是语法的特定写法不一致，所以记录一下。

1. 不允许使用默认参数

默认参数需要写在定义部分，不能写在实现部分。

const ARRAY_DEFAULT_CAPACITY = 8;

template <class T>
class Array{
    Array( int capacity ); // 有效
    Array( int capacity = ARRAY_DEFAULT_CAPACITY ); // 有效
}

// 错误， 不允许使用默认参数
template<class T>
Array<T>::Array( int initCapacity = ARRAY_DEFAULT_CAPACITY ){
    ...
}

2. 空参数实例化错误

使用空参数实例化的时候，不能使用()，会被编译器识别为函数定义

// 使用上述定义

Array<float> arr(10) // 正确 容量为10
Array<float> arr();  // 错误 容量为默认长度 无法实例化
Array<float> arr;    // 正确 容量为默认长度 可以实例化

字符串匹配算法KMP, BM_BC/BM_GS如何理解？ C++语言

作者: sprite
时间: 2020-07-16
分类: C++,算法
评论

字符串匹配： KMP算法， BM_BC, BM_GS算法

字符串匹配是搜索算法的基础，也是数据结构中一个十分有用的算法分支，我在学习KMP和BMBC算法的时候就觉得听的云里雾里，但经过一些实操和分析不难发现，这几个算法都是很好理解，并且对算法有很务实启发的。

以下我从零开始梳理以下如何建立一个清晰，并且有一定模式的理解这两个算法的思路。

1. 什么是字符串匹配

从一个字符串中查询是否完全包含另一个字符串的过程。如果有则返回起始位置，无则匹配失败。例：在 "这是一个多美丽又遗憾的世界" 匹配 "美丽" 应该返回5. 匹配"太美丽" 失败。

前菜开始：

2. 直观解法循环遍历

令字符串 S = "这是一个多美丽又遗憾的世界" 模式串(待匹配子串) s = "美丽" 循环遍历S并且在每一次S[i]与 s[j=0]匹配时，依次比较 S[i++] 与 s[j++]，若成功则可以返回当前的 i-j 即为第一个字符所在的位置，失败则 i = i-j，再右移1位继续比较。

* 边界情况，当 i> m-n 时，宣告失败。也就是说剩余可以配的元素已经不足够了，无需比较即告失败。另外，约定查找失败时，返回-1；

算法示例:

int matchStr( char * S, char * s )
{
    size_t m = strlen(S), n = strlen(s);
    int i =0, j = 0;
    while( i < m-n+1 && j<n ){
        if( S[i] == s[j] ){
            i++;j++;
        }else{
            i -= j-1; // i = i-j+1
            j = 0;
        }
    }
    return j==n ? i-j : -1;
    // 当且仅当j与n相等时，模式串最后一位匹配成功
}

循环遍历的方式有什么问题呢？那就是机械，无论如何都需要完整遍历S，并且每一次至少需要比对1次，而从渐进角度来说总体来说复杂度是达到O(m*n)。

接下来才是正餐：

3. 优化方向/算法策略

优化的可能性仔细分析一下，就是如何减少没必要的匹配。首先我们看一下，模式串都有哪些可能性呢？（这里只需要考虑前缀，因为如果不是前缀重复，发生失配的时候一定是要从第一位开始比较的）

1 . 真前缀永不重复

a b c d e f g

2 . 单元素真前缀重复 / 真·一元前缀字串重复

a a a a b c a a e

3 . 真·多元前缀字串重复

a b c a b c a b c a a b

那么接下来，分别看一下这几种不同的模式串，分别有怎样的优化方式。

- 阅读剩余部分 -

C++ 重载操作符

作者: sprite
时间: 2020-07-05
分类: 笔记,C++
评论

C++ 几乎可以重载全部的运算符，而且只能够重载C++中已经有的。

· 不能重载的运算符：“.”、“.*”、“::”、“?:” · 重载之后运算符的优先级和结合性都不会改变。

可以重载为类的非静态成员函数；可以重载为非成员函数。

重载单目运算符，前置的单目运算符不需要提供形参。如 `++ -- *= +=`...

而后置的单目运算符是需要提供参数来区别前置（为了重载）的。

class Even{
    int number=0;
    public:
    A & operator ++ (){
        number +=2;
        return *this;
    }
    A operator ++ ( int ){
        int old = number;
        ++(number);
        return old;
    }
}

前置++ 返回的是左值，而后置++ 返回的只是一个右值。

重载双目运算符，需要提供一个形参。如 `+ - * % /`...

class Matrix{
    int ** elements;
    int sizeX;
    int sizeY;
    public:
    Matrix & operator + ( const Matrix & m ) const{
        int newX = m.getX() > this.sizeX ? m.getX() : this.sizeX;
        int newY = m.getY() > this.sizeY ? m.getY() : this.sizeY;
        Matrix _new(newX,newY);
        for( int i = 0; i< newX; i++ ){
            for( int j =0; j< newY; j++ ){
                _new[i][j] = m[i][j] + elements[i][j];
            }
        }
        return _new;
    }
}

重载为非成员函数

当需要对当前程序没有权限的类型进行操作符重载的时候，或是将不同类型重载到一起运算，都需要进行非成员函数重载。

重载时需要从左至右依次声明参与预算的各个参数

这个时候可以理解为以重载的形式写的常规函数。

非成员函数的重载操作符参数，不能全为普通类型。

C++ 构造函数的运用，继承、派生时的重载方式

作者: sprite
时间: 2020-07-05
分类: 笔记,C++
评论

构造函数

c++在进行实例化的时候通常需要使用构造函数，没有显示构造函数的时候，系统会默认一个所有参数为空的默认构造函数。

C++中的构造函数有很多细节，其中从语法上来说，定义在函数声明的部分，是会优先于构造函数本身执行。譬如说以下的两种方式，会有不同的效果。

class A{
    int X;int Y;
    public:
    A( int x, int y ){
        std::cout << X << std::endl;
        X = x; Y = y;
    }
}
class B{
    int X;int Y;
    public:
    B( int x, int y ): X(x),Y(y){
        std::cout << X << std::endl;
    }
}

A,B都能分别完成对象的构造，区别在于B由于是在声明阶段定义了两个形式参数将要被放置到的对象属性中，所以A的构造函数不能在函数体内的第一行输出我们期望的值。而B中，X属性已经完成了初始化，可以顺利的输出我们的期望值。另外由于省略了建立、销毁局部参数的过程，这种声明式的构造函数效率更好。

派生类中的构造函数

在派生类中使用构造函数时，需要同时构造基类的构造函数，如果同时继承多个基类，则需要依次构造基类。在没有进行基类构造的时候，c++会默认使用基类的默认构造函数进行构造，但如果不满足这样的条件，就会报错。

class A{
    int a;
    public:
    A( int a ):a(a){}
}
class B{
    char b;
    public:
    B( char b ):b(b){}
}

class C : public A, public B{
    bool c;
    C( int a, char b, bool c ):A(a),B(b),c(c){}
}

这是一个最基本的多继承构造函数的形式。

有些时候我们可能会需要一些变种构造函数，也就是重载。譬如说当我们基于Matrix设计一个九宫格类的时候，实际上matrix的行和列都是固定的3x3.我们并不需要这两个参数来初始化。这样的话，我们就可以使用单参数的形式重载九宫格类的构造函数：

template <typename T>
class sMatrix : public Matrix<T>{
private:
    int _sign;
public:
    sMatrix( int sign ): Matrix<T>(3,3), _sign(sign){ cout<< _sign << endl; }
    sMatrix( int x, int y, int s ):Matrix<T>( x, y ){
        cout << _sign << endl;
        _sign = s;    
        cout << _sign << endl;
    }
};

C++ 创建动态二维数组

作者: sprite
时间: 2020-07-03
分类: 笔记,C++,算法
评论

在C++中创建数组的时候需要声明数组的长度，在声明一个二维数组的参数时，则至少需要确认第二维的长度，否则就无法完成编译。为什么呢，我们可以用一张图来表示c++二维数组在内存中的表示就理解了。

实际上在创建数组的时候，c++是根据最低维，也就是最靠后的那个维度最大值来分配连续内存空间的。譬如int[2][5]就会分配10*4个字节空间出来，如果不知道最后一个维度，c++就不知道如何开辟内存空间了。

二维数组返回的就是整个数组的首元素地址。而访问则是根据最后维的长度进行运算后得出：

/*
 * c++ 二维数组
 * 
 * hello@shezw.com 2020.07.03
 */

#include <iostream>
#include <string>

using namespace std;

int main()
{
   int a[2][5] = {1,2,3,4,5,6,7,8,9,10};

    for( auto e:a ){
        printf( "%p : %d \n",e,*e );
    }
    printf( "%p : %d \n",&a[1][3],a[1][3] );
    printf( "%p : %d \n",&a[0][8],a[0][8] );

}

输出:

0x7fffa508a870 : 1 
0x7fffa508a884 : 6 
0x7fffa508a890 : 9 
0x7fffa508a890 : 9

可以看到 a[0][8] 其实是完全等价于 a[1][3] 的,实际上a[1][3] 就是从第一个空间开始往后数第3+1*5 = 8个。

在数据结构、算法与应用一书中约定了一种动态创建二维数组的方式。

这种方式的核心是先构造一维指针数组，再将每个指针指向对应列的首元素。

为了调用和使用方便，我这里设计一个Matrix模板类，专门用于这样的动态二维数组的使用。

/*
 * c++ 二维数组
 * 
 * hello@shezw.com 2020.07.03
 */

#include <iostream>
#include <string>

using namespace std;

template <typename T>
class Matrix{
private:
    T ** _elements;
    int _colSize;
    int _rowSize;

public:
    Matrix( int rows, int cols ){
        _colSize = cols;
        _rowSize = rows;
        _elements = new T * [rows];
        for( int i=0;i<rows;i++ ){
            _elements[i] = new T [cols]();
        }
    }

    ~Matrix(){
        for( int i=0;i<_rowSize;i++ ){
            delete [] _elements[i];
        }
        delete [] _elements;
    }

    int getSize(){ return _colSize * _rowSize; };
    int colSize(){ return _colSize; };
    int rowSize(){ return _rowSize; };

    // 函数形式
    const T & get( int row, int col ){
        return _elements[row][col];
    }
    // 重载操作符形式
    T* & operator[]( int row ){
        return _elements[row];
    }
    // 重载操作符形式 只读
    const T* & operator[]( int row) const{
        return _elements[row];
    }
    void print(){

        for( int i=0; i< _rowSize; i++ ){

            printf( "\n row %p: \n", _elements[i] );

            for( int j=0; j< _colSize; j++ ){
                printf( "  col %p - %d\n", &_elements[i][j], _elements[i][j] );
            }

        }

    }
};

int main()
{
   Matrix<int> m(3,5);
    m[2][1] = 15;
   m.print();
}

编程语言在线文档/参考

作者: sprite
时间: 2020-07-03
分类: 笔记,开发
评论

c++ 参考手册中文 https://zh.cppreference.com/w/首页 c++ reference.com https://en.cppreference.com

c++ SLT reference

...

C++ 指针、引用的梳理

作者: sprite
时间: 2020-07-02
分类: C++
评论

* 指针运算符可作为左值。表示查询到指针所对应的内存空间这样的操作。

& 地址运算符，可以概括为取址运算符，从变量或对象等获取到该元素所在的内存空间中对应的地址。

指针定义

int i = 0;
int * pt = &i;

/* 
 未定义类型指针
 void类型指针可以存入任何类型的变量地址，但是不能直接被使用。使用的时候需要强制转换类型。
*/
int  i = 10;
bool b = false;
void * tentativePointer;
tentativePointer = & i;
i += static_cast<int *>(tentativePointer);
tentativePointer = & b;
b = !static_cast<bool *>(tentativePointer);

// 常量指针  指针所对应的地址的值被保护
int a;
a = 10; // √ a是变量 可以修改
const int *p1 = &a; // 指针
*p1 = 5; // × 不能通过p1 给a赋值

int b = 5;
p1 = &b; // √ 可以将p1转向其他变量

// 常指针  指针的地址被保护，即确定地址之后 不能修改，但对应的值可以修改。
int a;
a = 10;
int * const p2 = &a;
*p2 = 5; // √

int b = 5;
p2 = &b; // ×

指向对象的指针

指向对象的指针和其他类型的区别在于，访问对象的属性或方法不能通过.操作符。需要使用->。

实际上这里的object->method()等价于 (* object).method()，这是c++提供的一种语法糖。

另外，每个对象的方法内，默认隐含了一个this属性，实际上是指向该对象本身的。

指针的运算

算数运算

对指针的运算并非对地址进行修改，而是对于指针所指向的内存空间进行偏移定位。而每一次移动的单位，取决于指针所表示的类型，例如 char 占用一个字节，那么 p++则会从010A0000前往010A0001，而如果是 int 类型，那么每次会移动4个字节，如从010A00B0前往010A00B4。由于数组在内存中是紧密相连排列的，所以我们也就可以通过第一个元素的地址和[n]下标来查询对应的元素。

int a[] = {1,2,3,4,5};
cout << *(a+3) << endl;
// 会输出4 
// *(a+3) 等价于 a[ 0 + 3 ]

关系运算

一般来说同类型的指针可以进行比较操作。另外可以将指针与0做比较，判断指针是否为空。(如果是新标准可能不行)

指针传参

指针传参是十分重要的一个特性了，失去了指针，C++也就失去了他最大的性能优势。传递指针本身是很容易的，即使用 * type param_name这样的形式定义参数即可。外部调用时，将对应的实参地址进行填入即可。

这时，如果为了保护数据的可靠性，可以用const修饰参数类型。

普通参数

// 批量打印
void printArray( const int * arr, int len ){
    for( int i=0; i<len; i++ ){
        cout << arr[i] << endl;
    }
}
int a[] = {1,2,3,4,5};
printArray( a,5 );

// 批量修改
void batchIncrease( int * arr, int len, int n ){
    for( int i=0; i<len; i++ ){
        arr[i] += n;
    }
}
int b[] = {1,2,3,4,5};
batchIncrease( b, 5, 2 );
printArray( b );

// 输出 3,4,5,6,7

当实参不是数组类型的时候，我们无法通过[]操作符进行寻秩操作，这个时候需要使用 * 运算符来获取地址对应的值。

void splitFloat(float x, int *intPart, float *fracPart) {
   *intPart = static_cast<int>(x); //取x的整数部分
   *fracPart = x - *intPart; //取x的小数部分
}

函数参数

需要实现传递函数作为回调函数的时候，我们可以将函数名作为函数指针参数传递进去。比较典型的用法是，遍历回调。例如我们对一系列的对象进行遍历的时候，我们设计的遍历函数是一个通用或者说一个接口，它能够支持调用者用各式各样的方式来处理遍历时的元素，那么这个时候函数指针是非常有用的。

函数指针参数的格式为:return_type( * function_name )( function_params )

template <typename T>
void forEach( T * elements, int len , void(* callback)( const T el ) ){

    for( int i=0; i<len; i++ ){
        callback( T )
    }
}

// 可以再考虑一下传递的T 采用引用的类型如何编写

除此之外，函数指针不仅限于传参，和普通类型一样，函数指针一样可以先定义，后赋值为各个具体的函数。

void (*pf)(int,char*);
void fun(int n,char *s) {......}
pf=fun;

指针类型函数

指针类型函数就是返回一个指针（内存地址）的函数。定义十分简单，在返回类型后增加 * 标识符即可。但是需要注意，返回的指针应当是一个返回后依然有效的指针，否则会产生越界，野指针或是更多错误。

这个问题很好理解，如果你在网上购物，给了一个地址，千万不要给酒店门牌号，因为快递送过来的时候，你已经不在酒店了。无论是租房还是买房，只要你收货的时候，你这个地址还是有效的，那就可以~

所以无论是返回外部变量中的有效地址，还是通过new 进行动态分配的空间地址，都是可以顺利返回给调用者。而动态分配的地址，永恒的点就是不要忘了delete。

其他补充

基于范围循环

for( type & e : array ){} 基于范围循环是类似于很多其他语言中提供的in循环,比如Javascript中的for( var k in arr ){}。

2020年7月

3. changeLength2D

3. 构造函数

5. trimToSize()

6. setSize

7. 重载[]

8. 重载==

9. 重载!=

10. 重载<