度量快速开发平台-专业、快速的软件定制快开平台

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 部件 流程 SQL
查看: 1681|回复: 1
打印 上一主题 下一主题

[分享] UTF8字符集csv文件在oracle下乱码问题处理

[复制链接]

235

主题

2547

帖子

5835

积分

论坛元老

Rank: 8Rank: 8

积分
5835
跳转到指定楼层
楼主
发表于 2020-3-18 14:31:15 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
1.问题描述
    在excel中生成了一个UTF-8编码格式的csv文件准备导入数据库,在notpad++下打开显示正常,编码集为UTF-8,通过pl/sql dev导入oracle是出现乱码,此时初步推断oracle字符集与本地操作不同导致的乱码
2.处理过程
  2.1 查看ORACLE字符编码集
       select userenv('language') from dual;
       此时oracle返回其字符编码为:SIMPLIFIED CHINESE_CHINA.ZHS16GBK
  2.2 添加操作系统对象字符编码系统变量
       在win10中添加如下系统变量
       变量名:NLS_LANG
       变量值:SIMPLIFIED CHINESE_CHINA.ZHS16GBK
  2.3 更改文件字符集
       2.3.1 excle
                 从excle导出的csv文件只能直接导出为utf-8格式,暂未发现有其他方法可以直接导出其他字符编码类型的csv文件
       2.3.2 notpad++
                 在notpad++中直接通过编码->转换为GB2312(notpad++没有gbk,gbk是GB2312的超集),结果文件出现乱码,此方法不可行;
                 在notpad++中新建一个空文件,将其字符编码集变为gb2312,再将原来csv文件的内容复制过来,发现没有出现乱码,且字符编码集设置成功
       2.3.3 sublime
                 使用sublime 安装ConvertToUTF8 插件可以实现编码集转换
                 安装过程:ctr+shift+p打开完成搜索框,输入install package 打开可安装插件列表界面,在此界面输入ConvertToUTF8 可直接安装该插件
                 使用方法:打开UTF编码集的csv文件,点击file->relaod with encoding,在其中选择目标字符编码,这里我们选中gbk,点击之后,文件已转化为gbk编码,再保存即可
        2.3.4 java编写工具类
  1. public void codeChange() throws IOException {
  2.         String sourceCharset = "utf8"; // 源文件编码
  3.         String targetCharset = "gbk"; // 目标文件编码
  4.         String newFileName=path.substring(0,path.lastIndexOf("."))+"_"+1+".csv";
  5.         File file =new File(path);//源文件
  6.         FileInputStream fileInputStream=new FileInputStream(file);
  7.         InputStreamReader inputStreamReader=new InputStreamReader(fileInputStream,sourceCharset);
  8.         BufferedReader bufferedReader=new BufferedReader(inputStreamReader);
  9.         File targetFile =new File(newFileName);//目标文件
  10.         BufferedWriter bufferedWriter=new BufferedWriter(new OutputStreamWriter(new FileOutputStream(targetFile),targetCharset));
  11.         String line=null;
  12.         while((line=bufferedReader.readLine())!=null){
  13.             bufferedWriter.write(line);
  14.             bufferedWriter.newLine();
  15.             bufferedWriter.flush();
  16.         }
  17.         bufferedWriter.close();
  18.         bufferedReader.close();
  19.     }
复制代码
2.4 注意事项
      2.4.1 在利用notpad++或sublime更改字符集时,最好先对文件进行备份,因为 编码转化可能是不可逆过程
      2.4.2 一般遇到字符编码不统一,修改一方即可,这里我们选择修改操作系统的是因为避免对其他文件造成影响,也可以选择修改oracle的字符编码集,但是对数据库中其他数据会造成影响

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
回复

使用道具 举报

542

主题

5916

帖子

1万

积分

作者

Rank: 7Rank: 7Rank: 7

积分
13589
沙发
发表于 2020-3-18 16:46:32 | 只看该作者
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|重庆度量科技  本站关键词:快速开发平台

GMT+8, 2024-12-27 16:26 , Processed in 0.133912 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表