Verwirrung. Unicode/Asci, wann wo was
Verfasst: 11.06.2017 21:07
Hi
Ich bin der Joe und neu hier, ich benutze PB schon seit 12 Jahren (und bin wahrscheinlich der letzte Mensch der noch jaPBe benutzt ^^) und das Unicode Zeugs hab ich nie benutzt & gebraucht (ausser unten in meiner Signatur) desshalb hab ich jetzt auch keine Ahnung wann es benutzt wird, wo, und wie es sich auswirkt !
Was ich weis: Mann konnte früher auf Unicode Exe generieren umstellen.
Geschätzte Auswirkungen:
1) Die executable ist dann größer (egal)
2) sollte ich ein File einlesen mit 1000 Zeilen, brauch ich doppelt so viel Ram oder nicht ? (sehr schlimm)
3) Es dauert dann länger die Datei einzulesen (schlimm)
4) Die unicode String Bearbeitung ist langsamer (schlimm)
5) Alter Beispiel Code der irgendwelche API's nutzt muss etwas angepasst werden (z.B Winsock Connection mit Timeout) (geht noch, bisschen Arbeit)
6) Die Verarbeitungsgeschwindigkeit&Reaktionszeit vieler Befehle ist langsamer oder nicht ? Wenn ja ! Auch sehr schlimm
Was ist wenn ich das #PB_Ascii Flag in ReadString benutze ist dann auch alles langsamer und braucht mehr Ram ?
Wird dann noch was umgewandelt von wegen Asci ti Unicode und der Compiler behandelt dann alles trotzdem intern als Unicode ?
Was genau bewirkt das PB jetzt Unicode only ist ? Einfach nur das es Dateien mit eigenartigen Zeichen im Dateinamen lesen & schreiben kann ?
Was war denn früher wenn mann ASCI eingestellt hatte, und z.B eine Txt Datei mit 400.000 Zeilen eingelesen hat, und dort zwischendurch mal eigenartige Zeichen vorgekommen sind ? wurden die dann bei der Verarbeitung einfach als ? abgetan ?
sprich aus blaXblub wurde bla?blub oder wurde aus blaXblub (das X steht für ein Unicode Zeichen) dann einfach blablub ? und in der Ausgabe dann das selbe, also entweder bla?blub oder blablub
Muss ich wenn ich eine TXT Datei einlese die komische Unicode Zeichen hat, dann auf UTF-8 stellen ? selbst wenn ich eine Unicode exe habe ? Was passiert wenn ich eine ASCI exe (mit alter PB Version nehme) dann auf UTF-8 stelle und dann ein File
mit Unicode Zeugs einlese ?
Das ist alles sehr verwirrend !
Es gibt den ASCI & Unicode Flag da wo mann auch das Thread Safe einstellen kann, daß die exe entsprechend generiert.
Dann noch dort wo Codepage (was ist das schon wieder ? das hab ich seit MS-DOS config.sys & autoexec.bat zeiten nicht mehr gesehen und verwendet) vorkommt (1200 Unicode) und dann noch in einzelnen Befehlen ?
Ich bin der Joe und neu hier, ich benutze PB schon seit 12 Jahren (und bin wahrscheinlich der letzte Mensch der noch jaPBe benutzt ^^) und das Unicode Zeugs hab ich nie benutzt & gebraucht (ausser unten in meiner Signatur) desshalb hab ich jetzt auch keine Ahnung wann es benutzt wird, wo, und wie es sich auswirkt !
Was ich weis: Mann konnte früher auf Unicode Exe generieren umstellen.
Geschätzte Auswirkungen:
1) Die executable ist dann größer (egal)
2) sollte ich ein File einlesen mit 1000 Zeilen, brauch ich doppelt so viel Ram oder nicht ? (sehr schlimm)
3) Es dauert dann länger die Datei einzulesen (schlimm)
4) Die unicode String Bearbeitung ist langsamer (schlimm)
5) Alter Beispiel Code der irgendwelche API's nutzt muss etwas angepasst werden (z.B Winsock Connection mit Timeout) (geht noch, bisschen Arbeit)
6) Die Verarbeitungsgeschwindigkeit&Reaktionszeit vieler Befehle ist langsamer oder nicht ? Wenn ja ! Auch sehr schlimm
Was ist wenn ich das #PB_Ascii Flag in ReadString benutze ist dann auch alles langsamer und braucht mehr Ram ?
Wird dann noch was umgewandelt von wegen Asci ti Unicode und der Compiler behandelt dann alles trotzdem intern als Unicode ?
Was genau bewirkt das PB jetzt Unicode only ist ? Einfach nur das es Dateien mit eigenartigen Zeichen im Dateinamen lesen & schreiben kann ?
Was war denn früher wenn mann ASCI eingestellt hatte, und z.B eine Txt Datei mit 400.000 Zeilen eingelesen hat, und dort zwischendurch mal eigenartige Zeichen vorgekommen sind ? wurden die dann bei der Verarbeitung einfach als ? abgetan ?
sprich aus blaXblub wurde bla?blub oder wurde aus blaXblub (das X steht für ein Unicode Zeichen) dann einfach blablub ? und in der Ausgabe dann das selbe, also entweder bla?blub oder blablub
Muss ich wenn ich eine TXT Datei einlese die komische Unicode Zeichen hat, dann auf UTF-8 stellen ? selbst wenn ich eine Unicode exe habe ? Was passiert wenn ich eine ASCI exe (mit alter PB Version nehme) dann auf UTF-8 stelle und dann ein File
mit Unicode Zeugs einlese ?
Das ist alles sehr verwirrend !
Es gibt den ASCI & Unicode Flag da wo mann auch das Thread Safe einstellen kann, daß die exe entsprechend generiert.
Dann noch dort wo Codepage (was ist das schon wieder ? das hab ich seit MS-DOS config.sys & autoexec.bat zeiten nicht mehr gesehen und verwendet) vorkommt (1200 Unicode) und dann noch in einzelnen Befehlen ?