标签归档:换行符

PHP 处理行结束符

我们平台有个功能支持导入一行一个编号的文本,进行批量处理,类似CSV文件,代码是这样的:

$arrLine = file($strFilePath);
foreach($arrLine as $k => $v){
}

一直用都用的好好的,今天有同事导入却不正常了。用记事本打开要导入的文件来看,发现文件里面的内容都是只有一行;用EditPlus打开来看却又是正常的,不过显示是Mac平台的文件,猜测应该是换行符不一样导致的。Google了一下,发现果然如此,不同操作系统的行结束符是不一样的:

  • Windows\DOS:\r\n <\li>
  • Unix\Linux:\n <\li>
  • Macintosh:\r <\li>

另外,TCP/IP协议传输文本结束符也是\r\n。PHP的文件系统函数file和fgets默认不检测行结束符,所以不能正确处理。可以将这些换行符处理成其他的,再来断行

$strFileContent = str_replace(array("/r/n", "/r", "/n"), ",", $strFileContent); 
$arrLine = explode(',' , $strFileContent);

PHP官网也提供了相应的解决方法,更改php.ini配置,或者ini_set(‘auto_detect_line_endings’, ‘On’)即可。

Note: 在读取在 Macintosh 电脑中或由其创建的文件时, 如果 PHP 不能正确的识别行结束符,启用运行时配置可选项 auto_detect_line_endings 也许可以解决此问题。

auto_detect_line_endings boolean
当设为 On 时,PHP 将检查通过 fgets() 和 file() 取得的数据中的行结束符号是符合 Unix,MS-DOS,还是 Macintosh 的习惯。

这使得 PHP 可以和 Macintosh 系统交互操作,但是默认值是 Off,因为在检测第一行的 EOL 习惯时会有很小的性能损失,而且在 Unix 系统下使用回车符号作为项目分隔符的人们会遭遇向下不兼容的行为。

PHP从4.3开始使用常量PHP_EOL来代替不同平台的换行符,在代码中也应该使用PHP_EOL而不是写\r\n,否则会造成不必要的平台环境问题。

参考链接:
Difference between \n and \r?
what is the difference between windows csv and mac csv?
PHP Fucntion file
PHP auto-detect-line-endings
When do I use the PHP constant “PHP_EOL”?