STM32CubeMX 硬件 CRC vs 软件 CRC 速度实测:基于STM32的MODBUS-CRC

最近在研究STM32的硬件CRC,想对比一下硬件CRC与软件CRC的运行速度。先看一下软件CRC的算法对应的代码:

uint16_t crc16_calculate(const uint8_t *data, size_t length) 
{ 
	uint16_t crc = 0x0000; // 初始值为0x0000 
	for (size_t i = 0; i < length; i++) 
	{ 
		crc ^= data[i]; 
		for (int j = 0; j < 8; j++) 
		{ 
			if (crc & 0x0001) 
			{ 
				crc = (crc >> 1) ^ 0xA001; // 0xA001是逆序的MODBUS多项式 
			} 
			else 
			{ 
				crc = (crc >> 1); 
			} 
		}
	} 
	return crc; 
}

如果看不懂没关系,让DeepSeek分析一下这段代码的功能:

和标准的MODBUS CRC对比结果如下:

可以看到,只是初始值不同。

接下来,在STM32CUBEMX中实现CRC的硬件配置。

1、基础配置

芯片型号这里选择的是STM32G030F6,时钟使用芯片内部RC,倍频到64MHZ。然后开启调式接口。

2、CRC配置

如下图所示:

左侧Computing位置1那里,选中CRC。

位置2那里,勾选前面的方框,激活硬件CRC。

位置3那里相对麻烦一些,修改的参数比较多,照着我图里的配置改就行。主要配置:CRC长度16bit,多项式X15+X2+X0,初始值0,输入数据翻转模式选字节,输出数据翻转使能,输入数据的格式为字节。

3、GPIO配置

配置两个IO为输出模式,用于CRC计算时输出高低电平,通过示波器查看所需时间。

4、生成工程

基操,不解释。

5、完善代码

生成工程后,先编译一下,确认没有报错,然后进行完善。

5.1 准备数据

定义一个192元素的数组和一个变量,用于进行CRC运算。

uint8_t test_data[192] = {0x00, 0x01, 0x02, 0x03, 0x04, 0x05, 0x06, 0x07, 0x08, 0x09, 0x0A, 0x0B, 0x0C, 0x0D, 
                          0x0E, 0x0F, 0x10, 0x11, 0x12, 0x13, 0x14, 0x15, 0x16, 0x17, 0x18, 0x19, 0x1A, 0x1B, 
                          0x1C, 0x1D, 0x1E, 0x1F, 0x20, 0x21, 0x22, 0x23, 0x24, 0x25, 0x26, 0x27, 0x28, 0x29, 
                          0x2A, 0x2B, 0x2C, 0x2D, 0x2E, 0x2F, 0x30, 0x31, 0x32, 0x33, 0x34, 0x35, 0x36, 0x37, 
                          0x38, 0x39, 0x3A, 0x3B, 0x3C, 0x3D, 0x3E, 0x3F, 0xA5, 0x3F, 0x9C, 0x5E, 0x4B, 0x7D, 
                          0x2A, 0x61, 0x86, 0x13, 0xF4, 0x0D, 0x39, 0x52, 0xB7, 0x8A, 0x1E, 0x6C, 0x45, 0x90, 
                          0xD3, 0x27, 0x5A, 0xB1, 0x7E, 0x04, 0x19, 0x8F, 0x36, 0xC2, 0x5D, 0xA0, 0x12, 0x6B, 
                          0x3C, 0x95, 0xE7, 0x4A, 0x81, 0xF3, 0x2D, 0x56, 0x9E, 0x07, 0x4C, 0xB8, 0x31, 0x7A, 
                          0xE1, 0x5F, 0x24, 0x93, 0x68, 0x0E, 0x47, 0xA9, 0xD5, 0x3A, 0x16, 0x8C, 0x62, 0xF7, 
                          0x4E, 0x01, 0xAA, 0x55, 0xAA, 0x55, 0xAA, 0x55, 0xAA, 0x55, 0x33, 0xCC, 0x33, 0xCC, 
                          0x33, 0xCC, 0x33, 0xCC, 0x0F, 0xF0, 0x0F, 0xF0, 0x0F, 0xF0, 0x0F, 0xF0, 0x5A, 0xA5, 
                          0x5A, 0xA5, 0x5A, 0xA5, 0x5A, 0xA5, 0x96, 0x69, 0x96, 0x69, 0x96, 0x69, 0x96, 0x69, 
                          0xC3, 0x3C, 0xC3, 0x3C, 0xC3, 0x3C, 0xC3, 0x3C, 0xF0, 0x0F, 0xF0, 0x0F, 0xF0, 0x0F, 
                          0xF0, 0x0F, 0x81, 0x7E, 0x81, 0x7E, 0x81, 0x7E, 0x81, 0x7E };
uint16_t crc16 = 0;

5.2 添加软件CRC程序

为了和硬件CRC进行速度对比,需要把相应的软件代码添加到工程中。

uint16_t crc16_calculate(const uint8_t *data, size_t length) 
{ 
	uint16_t crc = 0x0000; // 初始值为0x0000 
	for (size_t i = 0; i < length; i++) 
	{ 
		crc ^= data[i]; 
		for (int j = 0; j < 8; j++) 
		{ 
			if (crc & 0x0001) 
			{ 
				crc = (crc >> 1) ^ 0xA001; // 0xA001是逆序的MODBUS多项式 
			} 
			else 
			{ 
				crc = (crc >> 1); 
			} 
		}
	} 
	return crc; 
}

5.3 控制相应IO输出

为了方便示波器观察,先拉高LED1管脚的电平,然后调用硬件CRC算法,最后拉低LED1管脚的电平。

同理,在软件CRC算法前后控制LED2管脚的电平。

  while (1)
  {
		//硬件CRC
		HAL_GPIO_WritePin(LED1_GPIO_Port, LED1_Pin, GPIO_PIN_SET);
    crc16 = HAL_CRC_Calculate(&hcrc, (uint32_t *)test_data, 192);
		HAL_GPIO_WritePin(LED1_GPIO_Port, LED1_Pin, GPIO_PIN_RESET);
    HAL_UART_Transmit(&huart1, (uint8_t *)&crc16, 2, 0xFFFF);
		//软件CRC
		HAL_GPIO_WritePin(LED2_GPIO_Port, LED2_Pin, GPIO_PIN_SET);
		crc16 = crc16_calculate(test_data, 192);
		HAL_GPIO_WritePin(LED2_GPIO_Port, LED2_Pin, GPIO_PIN_RESET);
		HAL_UART_Transmit(&huart1, (uint8_t *)&crc16, 2, 0xFFFF);
    /* USER CODE END WHILE */

    /* USER CODE BEGIN 3 */
  }

通过这种方式,用示波器看IO高电平持续时间即可得出算法运行时间。

6、下载上电

编译下载,接入示波器。先看LED1脚高电平持续时间:

可以看到,高电平持续时间约26us多一点。即,STM32硬件CRC对这些数据校验,所需时间约26us。

然后看LED2脚高电平持续时间:

可以看到,高电平持续时间约360us多一些。即,STM32使用软件算法实现CRC校验,所需时间约360us多。

对比两者,可以明显看到硬件CRC执行速度更快,仅为软件方式的十分之一不到。所以,硬件允许的情况下,尽量使用硬件CRC的方式,速度快,节省时间。

我是单片机爱好者-MCU起航,打完收工!

有需要源码的,公众号回复关键词:030,或者“32硬件CRC”。

发表评论

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理