Вы забыли, о чем была речь, напомню Ваши слова:
В большинстве случаев он должен быть выставлен в utf8_general_ci, тогда понятие длины строки приобретает некую абстрактную форму, и о том, что есть разница в длине символов для различных языков можно просто забыть
Это не так.
При utf8_general_ci есть разница в длине символов для различных языков. Не следует об этом забывать. Потому что в utf-8 переменная длина символа — от 1 байта до 4 (теоретически 6).
Или дайте ссылку, что в utf8_general_ci все символы имеют одинаковую длину. Но этого не может быть, так как это противоречит природе UTF-8.