vb.net里面是编码的简单介绍

vb.net 如何将编码GB2312转成UTF8

Imports System.Text

成都创新互联公司是一家专注网站建设、网络营销策划、小程序设计、电子商务建设、网络推广、移动互联开发、研究、服务为一体的技术型公司。公司成立十余年以来,已经为上千余家石牌坊各业的企业公司提供互联网服务。现在,服务的上千余家客户与我们一路同行,见证我们的成长;未来,我们一起分享成功的喜悦。

Public Function StringAsUtf8Bytes(ByVal strData As String) As Byte()

Dim bytes() As Byte

bytes = Encoding.UTF8.GetBytes(strData)

Return bytes

End Function

说明:strData参数是GB2312字符串,函数返回UTF8字节数组

vb.net怎么把汉字转换为GB2312编码,例如“广东”变成%B9%E3%B6%AB

GB2312是GBK编码的子集,使用GBK编码函数即可

'GBK编码(结果以百分号%进行分隔)

Public Function GBKEncode(ByVal sInput As String) As String

Dim ret_GBKEncode As String = ""

Dim i As Integer

Dim startIndex As Integer = 0

Dim endIndex As Integer

Dim x() As Byte = System.Text.Encoding.Default.GetBytes(sInput) '字符以及字符串在vb2008中都是以unicode编码存储的

endIndex = x.Length - 1

For i = startIndex To endIndex

ret_GBKEncode = "%" Hex(x(i))

Next

Return ret_GBKEncode

End Function

'GBK解码

Public Function GBKDecode(ByVal sInput As String) As String

sInput = sInput.Replace("%", "")

Dim ret_GBKDecode As String = ""

Dim sLen As Integer = sInput.Length

Dim n As Integer = sLen \ 2

Dim sBytes(0 To n - 1) As Byte

'转化为字节码

For i As Integer = 1 To n

sBytes(i - 1) = CByte("H" sInput.Substring(2 * i - 2, 2))

Next

'将字节码转化为字符串

ret_GBKDecode = System.Text.Encoding.Default.GetString(sBytes)

Return ret_GBKDecode

End Function

vb.net中string 转 unicode 编码

Unicode编码是一个数组,其中每个元素代表一个位码,还有ASCII和UTF8两种编码格式。

Unicode:

Dim bytes() As Byte() = System.Text.Encoding.Unicode.GetBytes("字符串")

ASCII:

Dim bytes() As Byte() = System.Text.Encoding.ASCII.GetBytes("字符串")

UTF8:

Dim bytes() As Byte() = System.Text.Encoding.UTF8.GetBytes("字符串")

VB.NET UNICODE码 显示

Public Class Form1

Dim b() As Byte

Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click

b = System.Text.Encoding.Default.GetBytes(TextBox1.Text)

For i = 0 To UBound(b)

TextBox2.AppendText(i.ToString  " ")

Next

End Sub

Private Sub Button2_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button2.Click

TextBox1.Text = System.Text.Encoding.Default.GetString(b)

End Sub

Private Sub Form1_Load(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles MyBase.Load

TextBox1.Text = "Google free online translation service instantly translates text and web pages。 该翻译器支持: 中文(简体), 中文(繁体), shqip, 日本语, русский, langue française ..."

End Sub

End ClassVB.Net中用String类型表示字符串,内部采用Unicode编码。当需要在网络或串口中收发字符串时,就需要在String和Byte数组之间进行转换,这项功能可以通过System.Text.Encoding类实现。

Private zeroChars() As Char = {ChrW(0)}

Dim descBytes() As Byte = System.Text.Encoding.Unicode.GetBytes(mDescription)

Dim description As String = System.Text.Encoding.Unicode.GetString(rBuffer, offset, length).TrimEnd(zeroChars)

说明:C语言中用'\0'表示字符串结束,而String类型中0是有效字符,显示时是空白字符,会占用显示宽度,可以用TrimEnd方法将字符串末尾的零字符去掉。

主要叙说一下StrConv 函数conversion参数最后两个值的含义和用途,并举例说明。

1、语法

StrConv(string, conversion, LCID)

StrConv 函数的语法有下面的命名参数:

部分 说明

string 必要参数。要转换的字符串表达式。

conversion 必要参数。Integer。其值的和决定转换的类型。

LCID 可选的。如果与系统LocaleID不同,则为LocaleID(系统LocaleID为缺省值。)

设置值

conversion 参数的设置值为:

常数 值 说明

vbUpperCase 1 将字符串文字转成大写。

vbLowerCase 2 将字符串文字转成小写。

vbProperCase 3 将字符串中每个字的开头字母转成大写。

vbWide* 4* 将字符串中单字节字符转成双字节字符。

vbNarrow* 8* 将字符串中双字节字符转成单字节字符。

vbKatakana** 16** 将字符串中平假名字符转成片假名字符。

vbHiragana** 32** 将字符串中片假名字符转成平假名字符。

vbUnicode 64 根据系统的缺省码页将字符串转成 Unicode。

vbFromUnicode 128 将字符串由 Unicode 转成系统的缺省码页。

*应用到远东国别。

**仅应用到日本。

说明:前面3个参数比较简单,后面4个我们用不上,就不说了,主要说说后面两个。

2、ANSI 格式

语法中说的缺省码页就是ANSI模式,英文环境下 的ANSI 格式其实也就是ASCII码,其它环境就不一样了,比如中文环境,就是ASCII,一个字节表示一个字符,GB2312,2个字节表示一个汉字,所以中文环境下的ANSI格式就是ASCII码+GB2312,早期的DOS系统中纯文本就是这种格式,这种格式下,通过最高位来判断是中文字符(最高位是1)还是ASCII字符(最高位是0)。中文环境下保存文本文件时一般都采用ANSI格式,不过也有其他格式,比如UTF-8。

3、Unicode编码

Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。Unicode用两个字节表示一个字符,涵盖了世界上所有字符,和以前的字符集都不兼容,VB内部字符串就是采用Unicode编码,所以当我们打开一个文本文件读入数据的时候,其内存中的内容和文本文件的内容是不一样的,经过了转换,除非你采用二进制方式读入。

4、vbUnicode和vbFromUnicode含义

有了上面叙说,这两个参数的含义就好理解了,就是Unicode编码和ANSI编码的互换,例如:

      textline= StrConv(plaintext,vbUnicode)  

这儿textline是以字符串变量,plaintext是以字节变量保存着ANSI模式的字符内容,例如,“2”这个字符,一个字节,值是50,16进制是32,“皖”这个汉字,两个字节,值是205和238,同样是这两个字符,作为字符串在内存中都是两个字节,例如,“2”这个字符在内存中16进制值是0032。当VB打开一个文件读取文本内容是,实际上自动进行了上述转换。

     plaintext = StrConv(textline, vbFromUnicode)

这儿进行相反的转换,就是将Unicode字符串转换成ANSI模式,转换结果必须以字节方式保存。

5、vbUnicode和vbFromUnicode用途

由于字符在内存中的内容和文件中的内容不一致,所以必须要用到这种转换,特别是系统间进行数据交换、数据加密和解密,如果不做转换可能导致得不到正确的结果。

比如,我们对一个文本文件进行加密,这个文件是ANSI格式存储的,当从文件内容读入一行到内存的时候,自动将内容转换成了Unicode格式,如果这时候对其做加密运算,其结果和文件中字符串加密结果是不一样的,这样的结果如果让别人解密将无法得到正确的结果。如果对读入内存的内容先做个转换(textline是读入内容):

     plaintext = StrConv(textline, vbFromUnicode)

再对plaintext做加密,其结果就一样了。

举例(按行做加密和解密运算,算法是AES+Base64):

[vb] view plain copy

Status = "Encrypting File"

Open FileName For Input As #1      ' 打开输入文件。

Open FileName2 For Output As #2     ' 打开输出文件。

Do While Not EOF(1)

Line Input #1, TextLine

plaintext = StrConv(TextLine, vbFromUnicode)

Status = "Encrypting Data"

m_Rijndael.SetCipherKey pass, KeyBits

m_Rijndael.ArrayEncrypt plaintext, ciphertext, 0

Status = "Converting Text to Base64"

TextLine = Base64Encode(ciphertext)

Status = ""

Print #2, TextLine    ' 将字符串写入文件。

Loop

Close

[vb] view plain copy

Status = "Decrypting File"

Open FileName For Input As #1      ' 打开输入文件。

Open FileName2 For Output As #2    ' 打开输出文件。

Do While Not EOF(1)

Line Input #1, TextLine

Status = "Converting Base64 to Text"

ciphertext = Base64Decode(TextLine)

Status = "Decrypting Data"

m_Rijndael.SetCipherKey pass, KeyBits

If m_Rijndael.ArrayDecrypt(plaintext, ciphertext, 0)  0 Then

Status = ""

Exit Sub

End If

TextLine = StrConv(plaintext, vbUnicode)

For i = 0 To UBound(plaintext)

Debug.Print plaintext(i)

Next i

k = InStr(1, TextLine, Chr(0), vbBinaryCompare)

If k  0 Then TextLine = Left(TextLine, k - 1)    '截掉加密时补的0

MsgBox TextLine  "end"

Status = ""

Print #2, TextLine    ' 将字符串写入文件。

Loop

Close

是用VB.NET自带的 BASE64 编码。然后用java的Base64能解码吗...

可能不行。

关键在于Base64 的码表不同,造成很多专用领域的base64算法。

比如,url中“/”有特殊含义,所依,在浏览器里一般都用“-、*”来替换“+、/”两个符号,造成不同的base64 变种。

如何用VB.net 读写Unicode编码的文本

不要用do until,用for:

Dim arr() As String, i As Integer

arr = Split(r.ReadLine, " ")

For i = LBound(arr) To UBound(arr)

MsgBox(arr(i))

Next

--------------------

还是用readline,如果你要提取两个非连续空格之间的字符串,可以用

Dim arr() As String

arr = Split(r.ReadLine, " ")

arr()数组里就存了你要的单词。

快要下班了,明后天不上班,如果16:30之前还搞不定就要下个星期1了。

----------------------------------

哈,是我的失误没想到还有可能有半角的日文。

用utf-8就OK了,代码如下:

(文本文件存的时候不能存成ansi,要存成utf-8,或是Unicode)

Private Sub Button1_Click(ByVal sender As System.Object, ByVal e As System.EventArgs) Handles Button1.Click

Dim r As System.IO.StreamReader

r = New System.IO.StreamReader("c:\a.txt", System.Text.Encoding.GetEncoding("utf-8"))

Do While Not r.EndOfStream

MsgBox(r.ReadLine)

Loop

End Sub


分享文章:vb.net里面是编码的简单介绍
文章来源:http://csdahua.cn/article/hehgce.html
扫二维码与项目经理沟通

我们在微信上24小时期待你的声音

解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流