git_clone中文乱码原因
@ lsq | 星期五,十一月 13 日,2020 年 | 1 分钟阅读 | 更新于 星期五,十一月 13 日,2020 年

windwos 系统中git clone 下来文件名乱码原因

  1. github上的文件名原来的编码就utf-8编码
  2. git clone 下来的uft-8编码被转为gb18030编码,因为中文的utf-8编码占用3个字节,中文的gb18030只占用两个字节(1,2,4),会把utf-8三个中的两个字节(此时被当作gb18030编码)再转为utf-8(三个字节),其中遇到错误时会被舍弃,如不想舍弃,需要用到–byte-subst参数,然后再用printf或者echo -e来重新编码。
pc@pc-PC MINGW64 /g/tmp/t/LaTeX_Notes
# echo -en `echo -en "texlive安装包下载地址"|iconv --byte-subst="\x%2x" -t utf-8 -f gb18030`|iconv --byte-subst="\x%2x" -f utf-8 -t gb18030
texlive安装包下载地▒\x80
pc@pc-PC MINGW64 /g/tmp/t/LaTeX_Notes
# printf $(echo -en `echo -en "texlive安装包下载地址"|iconv --byte-subst="\x%2x" -t utf-8 -f gb18030`|iconv --byte-subst="\x%2x" -f utf-8 -t gb18030)
texlive安装包下载地址
# echo -en "texlive安装包下载地址"|xxd
00000000: 7465 786c 6976 65e5 ae89 e8a3 85e5 8c85  texlive.........
00000010: e4b8 8be8 bdbd e59c b0e5 9d80            ............
pc@pc-PC MINGW64 /g/tmp/t/LaTeX_Notes
# echo -en "0000000: e5ae" |xxd -r |iconv -f gb18030 -t utf-8
瀹

© 2011 - 2023 lsq 的博客

Powered by Hugo with theme Dream.

avatar
关于我

lsq 的 ❤️ 博客

记录一些 🌈 生活上,财务相关技术上的事

毕业于 🏫 东北财经大学

空闲时间会做分享财务工作上相关技术

主要分享是:

  • VBA & Power Query
  • Excel 图表制作
  • LaTeX

写着玩:

  • Ruby
  • Bash shell
  • Python

目前在深圳工作

– 2021 年 04 月 11 日更新