<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<META NAME="Generator" CONTENT="MS Exchange Server version 5.5.2658.34">
<TITLE>RE: [X-Unix] text file parsing?</TITLE>
</HEAD>
<BODY>

<P><FONT SIZE=2>Use the &quot;strings&quot; command in your script to remove binary data.</FONT>
<BR><FONT SIZE=2>&nbsp;</FONT>
<BR><FONT SIZE=2>Use &quot;tail&quot; and &quot;head&quot; commands to work trim from or to the end or beginning.</FONT>
<BR><FONT SIZE=2>&nbsp;</FONT>
<BR><FONT SIZE=2>If it is indeed UTF-8 (or any other encoding) use textutil to change the encoding (or even the format) as you like. (Only available on OS X, so this would make your script non-portable to other Unixish OSes.</FONT></P>

<P><FONT SIZE=2>&nbsp;</FONT>
<BR><FONT SIZE=2>Use sed or awk for other text manipulations. Just get back to this list with specific questions, because sed and even more so awk can be tricky. Of course you can also ask about the other commands if the man pages don't help you much (which I sometimes find the case for me.)</FONT></P>

<P><FONT SIZE=2>&nbsp;</FONT>
<BR><FONT SIZE=2>Björn</FONT>
<BR><FONT SIZE=2>&nbsp;</FONT>
</P>

<FONT SIZE=3><BR>
<BR>
--------------------------------------------------------------------------------<BR>
The information contained herein is confidential and is intended solely for the<BR>
addressee. Access by any other party is unauthorised without the express <BR>
written permission of the sender. If you are not the intended recipient, please <BR>
contact the sender either via the company switchboard on +44 (0)20 7623 8000, or<BR>
via e-mail return. If you have received this e-mail in error or wish to read our<BR>
e-mail disclaimer statement and monitoring policy, please refer to <BR>
http://www.drkw.com/disc/email/ or contact the sender. <BR>
--------------------------------------------------------------------------------<BR>
</FONT>
</BODY>
</HTML>