一、设计方式一for (int i 0; i ROWS 2; i) {//LOOP1for(int j 0; j COLS_BLOCK; j) {#pragma HLS PIPELINE II1if (i ROWS) {line_buf[wptr][j] src.read();}}//LOOP2for (int j 0; j COLS_BLOCK 1; j) {#pragma HLS PIPELINE II1////////////////////////////////////////////////////////////////}}二、设计方式二for (int i 0; i ROWS 2; i) {//LOOP1for(int j 0; j COLS_BLOCK; j) {#pragma HLS PIPELINE II1}//LOOP2for (int j 0; j COLS_BLOCK 1; j) {#pragma HLS PIPELINE II1if (i ROWS) {line_buf[wptr][j] src.read();}////////////////////////////////////////////////////////////////}}三、对比方式一的时序要好一些方式一的资源要多一些方式一的latency要大一些方式二的时序要差一些方式二的资源要少一些方式二的latency要小一些。四、优化版本V3.0上述Latency304475个clock上述1522498000ps-113000ps1522385000ps.