iPad使用HTML5导入文本丢失怎解_HTML5导入iPad文本保全法【贴士】_技术教程

iPad上HTML5文件读取中文乱码的根源是iOS Safari的FileReader不自动识别UTF-8 BOM且默认ISO-8859-1解码，应改用arrayBuffer()+TextDecoder手动处理BOM与编码。

HTML5 在 iPad 上无法可靠导入文本，不是你操作错了，是浏览器限制了文件系统访问权限——input[type="file"] 触发的读取行为在 iOS Safari 中默认不支持 readAsText 的完整编码识别，尤其对 UTF-8 BOM、换行符（\r\n vs \n）、中文字符边界处理极不稳定。

为什么 iPad 上 `FileReader.readAsText()` 会丢字或乱码

iOS Safari 的 FileReader 实现存在两个关键缺陷：

不自动检测 UTF-8 BOM，若文本文件带 BOM，readAsText() 可能截断首字或误判编码
对 File 对象的 slice() 方法支持不一致，部分 iPadOS 版本中 file.slice(0, 100) 返回空或异常长度
未指定 encoding 参数时，iOS 默认按 ISO-8859-1 解码，中文直接变

用 `FileReader.readAsArrayBuffer()` + 手动解码保全中文

绕过编码黑箱，自己控制解码逻辑。这是目前最稳的方案：

必须使用 readAsArrayBuffer() 读取原始字节
用 TextDecoder 显式指定 utf-8，并启用 fatal: false 容错
避免依赖 file.text()（iOS 不支持）或 new TextDecoder().decode(buffer)（不处理 BOM）

const input = document.querySelector('input[type="file"]');
input.addEventListener('change', async (e) => {
  const file = e.target.files[0];
  if (!file) return;
const arrayBuffer = await file.arrayBuffer();
// 手动跳过 UTF-8 BOM（EF BB BF）
let offset = 0;
const view = new Uint8Array(arrayBuffer);
if (view.length >= 3 && view[0] === 0xef && view[1] === 0xbb && view[2] === 0xbf) {
offset = 3;
}
const decoder = new TextDecoder('utf-8', { fatal: false });
const text = decoder.decode(arrayBuffer.slice(offset));
console.log(text); // 此时中文、换行、标点全部保留
});