[爆卦]C# 陣列 轉型是什麼?優點缺點精華區懶人包

為什麼這篇C# 陣列 轉型鄉民發文收入到精華區:因為在C# 陣列 轉型這個討論話題中,有許多相關的文章在討論,這篇最有參考價值!作者tw30912 (tw30912)看板C_Sharp標題[問題] 丟陣列中文字串給c++ dll...


我的程式很簡單
用 c# 引用 c++ 的 dll

c++ dll 的內容如下:

extern "C" _declspec(dllexport) void func1(char* inputStr)
{
return;
}

extern "C" _declspec(dllexport) void func2(char* inputStrArr[])
{
char* inputStr0 = inputStrArr[0];
char* inputStr1 = inputStrArr[1];
return;
}


c# 端的內容如下:

class Program
{
[DllImport("CPP.dll")]
public static extern void func1(string inputStr);

[DllImport("CPP.dll")]
public static extern void func2(string [] inputStrArr);


static void Main(string[] args)
{

string s0 = "中文chinese";
string s1 = "嗨123";
func1(s0);
func1(s1);


string[] strArr = new string[2];
strArr[0] = s0;
strArr[1] = s1;
func2(strArr);
}
}


說明:

我有2個函數 func1 可以傳入單一字串,

func2 則可傳多個字串, 以字串陣列的方式傳給 c++


現在, 我有2個字串, s0 和 s1. 都含中文字符

首先, call func1 兩次, 分別傳入 s0 和 s1 自 c++ 端

c++ 端看到的字串內容正確, 字尾沒有少算.


接著, call func2 , 把 s0 和 s1 包成 strArr 傳入 c++ 端

在傳入前, 有在 c# 端檢查 strArr, 字串內容正確

但是傳入 c++端後, 字串內容異常

inputStr0 = "中文chine"

inputStr1 = "嗨12"




我一直搞不懂的地方是,

為什麼用 func1 的時候,

c++ 端看到的中文字串長度不會被少算???





--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.163.216.67 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/C_Sharp/M.1589007635.A.358.html
OppOops: 因為 compiler 大概有幫你 Marshal 做好 05/09 16:02
OppOops: c# string 用的是 UTF-16, 對應 c++ 要用 wchar_t 05/09 16:03
OppOops: 或是 LPWSTR 05/09 16:04
OppOops: 另外 char* 要判斷長度得在字尾加上 '\0' 05/09 16:06
OppOops: 是 string[] 的話大概 runtime 也沒幫你加上吧 05/09 16:07
OppOops: 或是直接當作是 ansi 來做長度判斷了 05/09 16:07
OppOops: 要轉型過去請自己 Marshal 好, 或是一律轉長寬字元 05/09 16:10

感謝你的回答,

關於 func1的問題, 我查了一下字串的預設封送處理

如果沒有寫 MarshalAs. 則默認值為 UnmanagedType.LPStr

其描述為“ANSI 字元之 Null 終端陣列的指標”

我的理解是, 他會把 c# 字串以 ANSI 解讀, 並找到字尾符號,

我的 c++ 端用 char* 接收, 恰好沒問題


不過, func2 也沒寫 MarshalAs

在 c++ 端得到的字串, 我用 memory 去看長這樣

inputStr0 = 中文chine.e

inputStr1 = 嗨12.

其中 . 代表句尾符號

我在想他是不是像 func1 一樣, array 中每個 string 都

被默認當成 ANSI 解讀, 且無遺漏複製給 c++

只是他會多做一件事, 在 c# string 原始長度的下一個位置改成字尾符號

例如, 原本 "中文chinese" 在 c# 長度為 9

可是他用 ANSI 解讀需要長度 11 才能描述

所以 c++ 的 char* 用長度 11 去裝他

但是在 c# string 原始長度 9 的下一個位置 10 會被改成字尾符號

所以 c++ 的 memory 才會看到 "中文chine.e"

不知道是不是這樣解釋?

另外, 確實寫好 MarshalAs 且 c++ 用 wchar 去接, 就沒問題.
※ 編輯: tw30912 (1.163.216.67 臺灣), 05/09/2020 18:20:09
OppOops: 大致上沒有錯 基本上我會使用清楚的寫法 05/09 19:02
OppOops: 依靠 compiler 預設行為的語法我會盡量避免 05/09 19:02
OppOops: Unmanaged / managed code 的轉換很多得靠自己 05/09 19:04
OppOops: 不然程式怎麼 crash 都不知道, 會很慘烈.. 05/09 19:05

你可能也想看看

搜尋相關網站