[php]UTF-8的fgetcsv函數

Microsoft的Excel有個很奇怪的怪僻
就是xls、xlsx裡面的文字是用UTF-8儲存

但如果另存新檔成csv時,會被降轉成Big5

有個方法可以避免這問題

直接選取資料,Ctrl+C做複製,直接在記事本之類的地方貼上
你會發現資料之間會用tab隔開

再用正規表達式,將  \t  取代成 , 
(tab字元取代成逗點) 

就可以用以下程式做匯入了

用法跟普通的fgetcsv一樣

但不能用以下程式寫成讀取tsv的程式

當遇上二個tab時(也就是有欄位是空的)

就會判斷錯誤喔,注意注意

 

//支援UTF-8的fgetcsv函數
function __fgetcsv(&$handle, $length = null, $d = “,”, $e = ‘”‘)
{
    $d = preg_quote($d);
    $e = preg_quote($e);
    $_line = “”;
    $eof=false;
    while ($eof != true)
    {
        $_line .= (empty ($length) ? fgets($handle) : fgets($handle, $length));
        $itemcnt = preg_match_all(‘/’ . $e . ‘/’, $_line, $dummy);
        if ($itemcnt % 2 == 0)
            $eof = true;
    }
   $_csv_line = preg_replace(‘/(?: |[ ])?$/’, $d, trim($_line));

    $_csv_pattern = ‘/(‘ . $e . ‘[^’ . $e . ‘]*(?:’ . $e . $e . ‘[^’ . $e . ‘]*)*’ . $e . ‘|[^’ . $d . ‘]*)’ . $d . ‘/’;
    preg_match_all($_csv_pattern, $_csv_line, $_csv_matches);
    $_csv_data = $_csv_matches[1];

    for ($_csv_i = 0; $_csv_i < count($_csv_data); $_csv_i++)
    {
        $_csv_data[$_csv_i] = preg_replace(“/^” . $e . “(.*)” . $e . “$/s”, “$1”, $_csv_data[$_csv_i]);
        $_csv_data[$_csv_i] = str_replace($e . $e, $e, $_csv_data[$_csv_i]);
    }
    return empty ($_line) ? false : $_csv_data;
}